阶段一:小规模数据处理篇 | ||
第一单元 | 掌握Python基础语法 | 1. 集合类型 |
第二单元 | 掌握NumPy进行数据分析 | 1. NumPy基本使用 2. Numpy进阶知识 |
第三单元 | 掌握Pandas进行数据分析 | 1. Pandas基础知识 2. Series数据结构 3. DataFrame数据结构 4. 综合案例演示 |
阶段二:中等规模数据处理篇 | ||
第四单元 | 掌握Elastichsearch核心设计 | 1. Elastichsearch总体架构设计 2. Elastichsearch核心流程分析 3. Elastichsearch核心概念详解 |
第五单元 | 掌握Elastichsearch API使用与调优 | 1. Elastichsearch语法详解 2. Elastichsearch容错原理剖析 3. Elastichsearch性能调优 |
第六单元 | 掌握ELK生态针对中等数据规模的方案实践 | 1. Logstash原理剖析与实战 2. Kibana原理剖析与实战 3. 企业级海量日志分析系统实战 |
阶段三:大数据基础平台篇 | ||
第七单元 | 掌握ZooKeeper核心设计与应用 | 1. ZooKeeper架构设计原理 2. ZooKeeper核心读写流程剖析 3. ZooKeeper企业应用场景实战 |
第八单元 | 掌握HDFS核心架构原理 | 1. 大数据基础知识 2. HDFS架构设计原理 |
第九单元 | 掌握HDFS企业级架构方案设计 | 1. HDFS高可用架构设计 2. HDFS联邦架构设计 3. HDFS企业级集群部署 |
第十单元 | 掌握MapReduce分布式计算模型 | 1. MapReduce核心原理剖析 2. MapReduce Shuffle机制深度剖析 3. MapReduce案例实操 |
第十一单元 | 掌握YARN任务调度模型 | 1. YARN架构设计原理 2. YARN核心运行流程 |
阶段四:大数据存储篇 | ||
第十二单元 | 掌握Hive核心架构设计 | 1. Hive生态体系 2. Hive集群安装 3. HQL语法精讲 |
第十三单元 | 掌握Hive企业实操 | 1. Hive函数精讲 2. Hive执行原理深度剖析 |
第十四单元 | 掌握Hive企业级解决方案 | 1. Hive企业级调优 2. Hive企业高频业务场景剖 |
第十五单元 | 掌握HBase核心架构原理 | 1. HBase架构设计原理剖析 2. HBase数据模型 3. HBase数据模型 4. HBase读写原理剖析 5. HBase企业级集群分布式部署 |
第十六单元 | 握HBase企业设计方案 | 1. HBase表设计 2. HBase RowKey设计 3. HBase二级索引方案实践 |
第十七单元 | 掌握Kafka核心架构设计 | 1. Kafka架构设计原理 2. Kafka核心概念深度剖析 |
第十八单元 | 掌握Kafka架构设计优势与运维 | 1. Kafka架构设计优势 2. Kafka集群部署与运维 |
第十九单元 | 掌握Kafka客户端原理与性能调优 | 1. Kafka生产者原理深度剖析 2. Kafka消费者原理 3. Kafka性能调优 |
阶段五:大数据采集篇 | ||
第二十单元 | 掌握Flume/Sqoop日志采集系统实践 | 1. Sqoop核心原理剖析 2. Sqoop企业案例实操 3. Flume核心原理剖析 4. Flume企业案例实操 |
阶段六:任务调度篇 | ||
第二十一单元 | 掌握Azkaban任务调度实践 | 1. Azkanban架构原理 2. Azkanban企业案例实操 |
阶段七:大数据处理篇 | ||
相关课程推荐: