我正在尝试将 Pandas 数据框导出到 .arff 文件以在 Weka 中使用它。我已经看到模块 liac-arff 可用于此目的。继续文档 here 似乎我必须使用arff.dump(obj,fp)
虽然,我正在努力使用 obj (字典),但我猜我必须自己创建它。你如何建议我正确地做到这一点?在大数据集(3 000 000 行和 95 列)中,您是否可以提供任何示例来使用 python(v 2.7)从 Pandas 数据帧导出到 .arff 文件?
最佳答案
首先安装软件包:$ pip install arff
然后在 Python 中使用:
import arff
arff.dump('filename.arff'
, df.values
, relation='relation name'
, names=df.columns)
其中 df
的类型为 pandas.DataFrame
。瞧。关于python - 将数据帧导出到 arff 文件 python,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48993918/