我尝试使用sparklyr将数据写入hdfs或hive,但无法找到方法。甚至可以使用sparklyr将R数据帧写入hdfs或hive吗?请注意,我的R和hadoop在两个不同的服务器上运行,因此我需要一种从R写入远程hdfs的方法。

问候
拉胡尔

最佳答案

使用Sparklyr将Spark表写入配置单元:

iris_spark_table <- copy_to(sc, iris, overwrite = TRUE)
sdf_copy_to(sc, iris_spark_table)
DBI::dbGetQuery(sc, "create table iris_hive as SELECT * FROM iris_spark_table")

关于sparklyr - sparklyr将数据写入hdfs或配置单元,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44790625/

10-12 22:48