1.格式化
首先格式化之后只剩下一个根目录。
格式化后会出现元数据
集群启动之后,元数据放在内存中的(消耗内存中)
格式化后会产生镜像文件fsimage,元数据存储
启动的时候namenode会读取镜像文件,知道整个系统的文件
在HDFS上的用户行为操作都会记录在编辑日志文件edits中(重要)
2.启动
在启动的时候,首先读取fsimage,然后去读edits
3.secondary namenode
会读取fsimage,然后去读edits。
然后将者两个文件的信息加载到内存中
会将信息写到一个新的镜像文件中,接着再生成一个deits文件
下次namenode启动时会读取新的fsimage文件
2017.12.20 通过阅读文档,这里进行补充(注意点是这个fsimage是secondary nameNode的):
4.作用
合并
减少namenode的启动时间
用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照
5.配置hdfs-site.xml
6.启动
7.管理界面
端口号50090