在设置伪集群或完整集群时,我们是否需要格式化数据节点以安装HDFS文件系统,或者只需要格式化namenode。
我之所以这么问是因为,我在许多博客上都读到过,HDFS将数据按顺序存储在硬盘上,它是一个抽象层,将数据存储在大块上,而不是主机文件系统提供的默认块大小存储中。
如果我们不格式化datanode,那么HDFS的强大功能就折腾了。
最佳答案
格式化和安装硬盘驱动器与格式化HDFS没有直接关系。从概念上讲,“格式化”的思想是相同的。但是,这两个任务是完全分开的,没有直接的关系。
hadoop format命令不会格式化或装入硬盘驱动器。硬盘驱动器应该已经格式化并挂载。当您为HDFS运行format命令时,它将准备NameNode fsimage文件,以便它知道所有存储块在数据磁盘上的位置。
关于hadoop - 我们是否需要格式化HDFS文件系统的datanode还是只需要格式化namenode,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54186393/