Apache Spark的工作原理


1 Why Apache Spark

2 关于Apache Spark

3 如何安装Apache Spark

4 Apache Spark的工作原理

5 spark弹性分布式数据集

6 RDD持久性

7 spark共享变量

8 Spark SQL

9 Spark Streaming

原文链接:http://blogxinxiucan.sh1.newtouch.com/2017/07/23/Apache-Spark%E7%9A%84%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/

Spark引擎提供了一种在一组机器上分布式内存中处理数据的方法。图7显示了典型的Spark作业如何处理信息的逻辑图。

4.Apache Spark的工作原理-LMLPHP

4.Apache Spark的工作原理-LMLPHP

主控制如何分割数据,并利用数据位置,同时跟踪从机上的所有分布式数据计算。如果某台从机不可用,该机器上的数据将在其他可用的机器上重建。“大师”目前是一个单一的失败点,但将在即将发布的版本中修复。


公众号:it全能程序猿

4.Apache Spark的工作原理-LMLPHP


05-07 15:26