我在开发环境中只有一台linux(ubuntu)服务器,我也打算在生产环境中使用一台服务器。

我有从Nutch 2.2.1生成的抓取数据,我想将其存储在HBase 0.90.6中。由于,我不打算使用多台机器(我只有一台服务器),对于我的情况,哪种HBase模式是生产环境的理想选择-伪还是完全分布式的?

最佳答案

伪分布式模式会更好,因为在独立模式下将使用本地FS。这意味着您无法利用HDFS + MR组合提供的并行性。

关于hadoop - HBase Pseudo分布式还是完全分布式模式?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19199089/

10-12 22:59