我知道您可以使用以下方法将spark数据框 df 转换为pandas数据框
但是,这花费了很长时间,因此我发现了数据砖中的考拉包,可以使我将数据用作 Pandas 数据框(例如,能够使用scikit learning)而没有 Pandas 数据框。我已经有了spark数据框,但是我找不到找到将它变成考拉树的方法。
最佳答案
要直接从pyspark数据框(我假设这就是您正在使用的)转到考拉数据框,可以使用:koalas_df = ks.DataFrame(your_pyspark_df)
在这里,我将考拉导入为ks。
关于python-3.x - 如何将spark数据框转换为databrick考拉数据框?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56706860/