• 我对Lucene有一些经验,我试图了解数据实际上是如何存储在Hadoop框架的从属服务器中的?
  • 我们是否在Slave Server中创建带有属性集的索引来描述我们要存储的文档?在现实中如何运作?
  • 最佳答案

    数据被分成一定大小的块,然后复制到群集中的其他节点以提高可靠性。该过程由单个“名称节点”处理,该名称节点跟踪哪些数据块已到达何处。

    Hadoop为您提供类似于Unix的虚拟文件系统,您可以使用各种Hadoop filesystem tools(ls,get,put等)进行查询。

    This link应该给您全面的概述。

    09-11 18:56
    查看更多