我在四个群集上设置了Cassandra
,在两个群集上设置了hadoop
,现在我想设置map reduce作业,以便它可以从Casandra
数据库中检索数据并进行分析。任何人都可以在这里告诉我逐步实现单词计数示例的过程吗?例如要更改的配置文件,以及如何将Cassandra
数据目录指向map-reduce作业?
最佳答案
您可以使用 pig 来分析数据。
http://frommyworkshop.blogspot.com/2012/07/single-node-hadoop-cassandra-pig-setup.html