您好,我只想知道如何在Spark Python中保存saveAsTextFile,而不用方括号和制表符分隔。

  ('123', 2),('345', 3),('567', 9) to a file->
    123   2
    345   3
    567   9

我知道有一种使用C样式打印的方法,例如:(%c'\ t'%i,(v1,v2))

提前致谢!

最佳答案

您可以进行映射以使它们的选项卡定界,然后可以轻松使用saveAsTextFile方法,如以下示例所示。

rdd = sc.parallelize([('123', 2),('345', 3),('567', 9)])
rdd.map(lambda x: "%s\t%s" %(x[0],x[1])).saveAsTextFile("output")

07-27 21:12