本文介绍了在Spark中将简单的单行字符串转换为RDD的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一条简单的话:
line = "Hello, world"
我想将其转换为仅包含一个元素的RDD.我尝试过
I would like to convert it to an RDD with only one element.I have tried
sc.parallelize(line)
但是它得到了
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
有什么想法吗?
推荐答案
尝试使用列表作为参数:
try using List as parameter:
sc.parallelize(List(line)).collect()
它返回
res1: Array[String] = Array(hello,world)
这篇关于在Spark中将简单的单行字符串转换为RDD的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!