本项目是使用scala语言给出了spark2.4.5计算框架中各模块的常用实例。

spark2.4.5计算框架中各模块的常用实例-LMLPHP

Spark Core

Spark SQL

Spark MLlib

Spark Streaming

Spark GraphX

所用数据集

代码中用到的数据集都可以在spark安装目录的data子目录中找到,具体为xxx\spark-2.4.5-bin-hadoop2.7\data

更多的用例

完整的用例在spark安装目录的examples子目录中。

具体为:xxx\spark-2.4.5-bin-hadoop2.7\examples\src\main\scala\org\apache\spark\examples

Spark的视频学习资料

推荐林子雨老师的慕课视频,质量高且免费,观看地址请点击这儿

。课程的PPT请点击这儿

spark书籍(电子版、可直接下载)

如果你觉得本项目对你有帮助,麻烦在GitHub上star支持一下。有任何问题,请新建issue交流。

04-18 15:53