在 scikit-learn 中,提供了两个函数来加载和转储 SVM^light 格式的文件:

sklearn.datasets.load_svmlight_file 和 sklearn.datasets.dump_svmlight_file

文档显示(并且函数支持)load_svmlight_file 可以加载多标签数据,即目标类别用逗号分隔,而不是将单个类别作为目标。 然而 , dump_svmlight_file 似乎不支持这一点。

我读错了,还是 dump_svmlight_file 出于某种原因不支持这个?甚至不可能通过传递带有基于字符串的目标值的 y 向量来“欺骗”它,因为文件编写器需要该值的浮点数。可以在 https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py 的第 230 到 262 行找到转储文件代码。

最佳答案

没错,dump_svmlight_file 目前不支持多标签任务。这是一个遗漏;您可以为其提交错误报告,尽管一个好的补丁(拉取请求)会导致更快的操作。

(签名,该模块的作者之一。)

关于python - Scikit-Learn:加载和转储多标签 SVM 光格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/17364220/

10-12 23:07