我目前正在几个项目中工作,分别是MongoDB和Apache Cassandra。我也经常使用Solr,我也在用它们处理“大量”的数据(大约1-2tb)。上周我第一次听说Greenplum和Vertica这个词,我不太确定应该把它们放在我的大脑里。在我看来,他们似乎喜欢数据仓库(DWH)解决方案,而我还没有真正工作过DWH。而且它们似乎花费了很多钱(例如,在Greenplum中存储1TB需要6万美元)。我目前没有处理数兆字节的数据,我认为不会这样做,但像Cassandra这样的产品似乎也能处理这个问题。
卡桑德拉是公认的NoSQL领导者
可以轻松地扩展到兆字节或千兆字节的数据。
通过http://www.datastax.com/why-cassandra
所以我的问题是:为什么人们应该使用Greenplum&Co?与这些其他产品相比,是否有巨大的优势?
谢谢。
最佳答案
Cassandra、Greenplum和Vertica都处理大量数据,但处理方式非常不同。
一些组成的用例,其中每个数据库都有其优点:
使用Cassandra:
tweets.insert(key:user, data:blob);
tweets.get(key:user)
使用青梅:
begin;
update account set balance = balance - 10 where account_id = 1;
update account set balance = balance + 10 where account_id = 2;
commit;
使用Vertica:
select sum(balance)
over (partition by region order by account rows unbounded preceding)
from transactions;