scala - 将Scala Iterable [tuple]转换为RDD | Spark

Spark

c - C程序结构

java - Java8 : How volatile field work with lambda

asp.net - 在网站项目中使用SignalR

java - Primefaces ConfirmDialog在使用ajax更新的表单中未垂直居中

java - 该组件未出现在西边界布局中

c - 为什么fread确实有线程安全要求，从而降低了调用速度

php - php pdo mssql声明插入选择

java - 从Eclipse迁移到Android Studio问题

php - 如何提示用户下载PHP生成的.CSV文件，以及如何处理删除该文件？

enums - 概括一个枚举的函数

java - Proguard与Maven

java - JPA @Column批注创建注释/描述

wpf - Silverlight中缺少的某些WPF功能的解决方法

c# - 这个WPF代码可以从Parallel.For中受益吗？

c# - C#使用XmlDocument获取XML元素值

scala - 将Scala Iterable [tuple]转换为RDD

扫码查看

我有一个要转换为Spark RDD的元组列表(字符串，字符串，整数， double )。

通常，如何将Scala Iterable [(a1，a2，a3，...，an)]转换为Spark RDD？

最佳答案

有几种方法可以做到这一点，但是最直接的方法就是使用Spark Context:

import org.apache.spark._
import org.apache.spark.rdd._
import org.apache.spark.SparkContext._

sc.parallelize(YourIterable.toList)

我认为sc.Parallelize需要转换为List，但是它将保留您的结构，因此您仍然会得到RDD [String，String，Int，Double]

10-02 03:06