我们一直在使用Apache社区提供的Standard Hadoop发行版。我们正在努力开发销售分析解决方案。基于以下文档
https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support
似乎有许多公司为Hadoop提供不同的发行版和商业支持。在我们的案例中,我们仅使用标准(Debian)Hadoop发行版。我们遇到许多问题。
我们的问题是我们应该使用Debian Hadoop发行版还是转移到Cloudera,Hortonworks,MapR等提供的其他发行版上?
最佳答案
有许多因素会影响您的决策,但以下是一些要点:
Cloudera-所有供应商中最昂贵的。他们的“Cloudera Manager”是一流的集群管理软件。
Hortonworks-最便宜且完全开源的组件。
MapR-在成本方面处于中等水平,但在性能方面绝对排名第一。他们完全摆脱了NameNode并进行了其他一些重大更改。
AWS-他们允许您以较低的每小时成本使用其基础架构。固定费用为$ 15k,对于大型公司,金额不定。如果使用此选项,则无需购买硬件。
还有许多其他发行版,例如Pivotal,IBM等,但是这三个是市场领导者。
希望这可以帮助。
关于hadoop - 我们应该遵循Debian Hadoop发行版还是转向由Cloudera,Hortonworks,MapR等提供的其他发行版?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40931837/