分布式文件系统比较出名的有HDFS 和 GFS,其中HDFS比较简单一点。本文是一篇描述非常简洁易懂的漫画形式讲解HDFS的原理。比一般PPT要通俗易懂很多。不难得的学习资料。

1、三个部分: 客户端、nameserver(可理解为主控和文件索引类似linux的inode)、datanode(存放实际数据的存server)

经典漫画讲解HDFS原理-LMLPHP

2、如何写数据过程

经典漫画讲解HDFS原理-LMLPHP

经典漫画讲解HDFS原理-LMLPHP

经典漫画讲解HDFS原理-LMLPHP

3、读取数据过程

经典漫画讲解HDFS原理-LMLPHP

4、容错:第一部分:故障类型及其检测方法(nodeserver 故障,和网络故障,和脏数据问题)

经典漫画讲解HDFS原理-LMLPHP

经典漫画讲解HDFS原理-LMLPHP

5、容错第二部分:读写容错

经典漫画讲解HDFS原理-LMLPHP

6、容错第三部分:dataNode 失效

经典漫画讲解HDFS原理-LMLPHP

7、备份规则

经典漫画讲解HDFS原理-LMLPHP

8、结束语

经典漫画讲解HDFS原理-LMLPHP

10-07 20:14