hadoop - 如何在Spark而不是RAM的磁盘上进行计算？ | 磁盘

磁盘

c# - ASP.NET 5 MVC 6 中的 web.config

mysql - 使用MySQL从表返回排名

docker - Docker加载内核模块

php - 使用MDBTools驱动程序与PHP ODBC的无DSN连接

mysql - [34，105]该表达式不是有效的条件表达式

.NET - 用户和不同的数据库

c++ - C++的Hello World错误

python - 如何在用gzip压缩的Python中解压缩文本？

sql - Postgres : one table with many columns or several tables with fewer columns?

php - Laravel，从迁移创建MySQL触发器

php - 从Web应用程序在预印纸上打印数据

mysql - 将列复制到另一个表

javascript - JavaScript打破了没有DST的时区

docker - 为什么在docker run上将入口点设为echo时未设置env变量？

php - 在网页上显示PHP代码

hadoop - 如何在Spark而不是RAM的磁盘上进行计算？

扫码查看

我是Spark的新手，想在磁盘上运行Spark Program。我想在磁盘而不是RAM上加载RDD，我该怎么做？

最佳答案

使用RDD.cache(DISK_ONLY)

它仅将RDD分区存储在磁盘上。

关于hadoop - 如何在Spark而不是RAM的磁盘上进行计算？，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/26861756/

10-16 16:40