我正在尝试将 Pandas 数据框导出到 .arff 文件以在 Weka 中使用它。我已经看到模块 liac-arff 可用于此目的。继续文档 here 似乎我必须使用arff.dump(obj,fp) 虽然,我正在努力使用 obj (字典),但我猜我必须自己创建它。你如何建议我正确地做到这一点?在大数据集(3 000 000 行和 95 列)中,您是否可以提供任何示例来使用 python(v 2.7)从 Pandas 数据帧导出到 .arff 文件?

最佳答案

首先安装软件包:$ pip install arff然后在 Python 中使用:

import arff
arff.dump('filename.arff'
      , df.values
      , relation='relation name'
      , names=df.columns)
其中 df 的类型为 pandas.DataFrame 。瞧。

关于python - 将数据帧导出到 arff 文件 python,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48993918/

10-11 07:39