hadoop这个重量级的"炸弹"近些年已引爆云存储和云计算,相信作为技术人的我们都对它略知一二吧,都说财力代表现在的努力,学习能力代表将来的成就,大数据分析已成趋势,你开始学习了吗?本文主要记录博主们关于hadoop的一些学习、使用的博文记录,也为第二期博客电子期刊做一个继续与补充。 http://focus.it168.com/topic/2012/1-19/blogep/index.html

 
入门篇
Hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可 以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的
Hadoop分布式文件系统:结构与设计

MapReduce 映射与化简算法 http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409646

Google MapReduce介绍 http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409645

 
系列学习篇
Hadoop-0.20学习笔记(1) 作者阅读hadoop-0.20.203.0官方手册的学习笔记。
Hadoop-0.20学习笔记(2) 记录hadoop集群的配置和运行
Hadoop-0.20学习笔记(3) Hadoop的MapReduce的java编程方法
Hadoop-0.20学习笔记(4) 记录HDFS的设计。
Hadoop-0.20学习笔记(5) MapReduce与HDFS的结合。不打算细致的分析代码的所有细节,目标是理解MapReduce是怎么run在HDFS上的。
布式计算开源框架Hadoop介绍── 分布式计算开源框架Hadoop入门实践(一) http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842299
Hadoop中的集群配置和使用技巧--分布式计算开源框架Hadoop入门实践(二)
分布式计算开源Hadoop基本流程与应用开发── 分布式计算开源框架Hadoop入门实践(三)http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842301
 
 
 
深入了解Hadoop    链接:http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842417
数据组织  兼容HDFS的应用都是处理大数据集合的。这些应用都是写数据一次,读却是一次到多次,并且读的速度要满足流式读。HDFS支持文件的write- once-read-many语义。一个典型的block大小是64MB,因而,文件总是按照64M切分成chunk,每个chunk存储于不同的 Datanode

hadoop使用笔记  链接:http://blog.chinaunix.net/space.php?uid=20761674&do=blog&id=74981

 

 

hadoop编程篇

Hadoop初步编程 链接:http://blog.chinaunix.net/space.php?uid=25098298&do=blog&id=95977

Hadoop编程实现之WordCount http://blog.chinaunix.net/space.php?uid=21948310&do=blog&id=409647

Hadoop编程入门 http://blog.chinaunix.net/space.php?uid=20787846&do=blog&id=1842422

欢迎在此贴下方继续分享您关于hadoop学习、使用的经验!!

·请参与继续分享的博主们在评论里贴博文链接与分类

09-25 19:26
查看更多