您好,我只想知道如何在Spark Python中保存saveAsTextFile,而不用方括号和制表符分隔。
例
('123', 2),('345', 3),('567', 9) to a file->
123 2
345 3
567 9
我知道有一种使用C样式打印的方法,例如:(%c'\ t'%i,(v1,v2))
提前致谢!
最佳答案
您可以进行映射以使它们的选项卡定界,然后可以轻松使用saveAsTextFile
方法,如以下示例所示。
rdd = sc.parallelize([('123', 2),('345', 3),('567', 9)])
rdd.map(lambda x: "%s\t%s" %(x[0],x[1])).saveAsTextFile("output")