我正在尝试在一个集群中设置来自Apache Hadoop堆栈的所有项目。建立Apache hadoop生态系统框架的顺序是什么?
例如:Hadoop,HBase,...
而且,如果您通过一组特定的步骤进行了测试,则可以告诉您在部署过程中可能会遇到什么样的问题。部署的主要框架(Hadoop,HBase,Pig,Hive,HCatalog,Mahout,Giraph,ZooKeeper,Oozie,avro,sqoop,mrunit,crunch,如果我错过了,请添加)

最佳答案

订单不同,因为并非所有列出的产品都依赖。
简而言之:
1. Hadoop(HDFS,MapReduce)
2. pig , hive ,鱿鱼,Oozie
2. Zookeeper(HBase所需)
3. HBase的

我不确定Mahout是否具有MRUnit依赖关系,但我认为只有在需要时才使用Hadoop。
Avro不直接依赖hadoop-它是序列化库。

关于apache - Hadoop生态系统部署步骤,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10547050/

10-11 05:15
查看更多