第一天的笔记,是伪分布hadoop集群搭建,
后面是hadoop Ha的分布式集群搭建
第一天,是HDFS的shell操作
NN工作机制
里面是二进制
DN工作原理
上传完了之后,在hdfs的虚拟路径下,有这个文件,其实,是切分成很多block,放到公共的datanode文件夹下。
134217728/1024/1024=128M,所以,分成个Block。
其实,此刻,blk_1073741856等价于jdk-7u65-linux-i586.tar.gz。
所以,文件被是切分成很多block,放到公共的datanode文件夹下。也可以合并,上述,就是合并,照样,达到复原。。。
这里,有个知识点,blk_1073741856和blk_1073741857,没有显示出来。