它记录在http://scikit-learn.org/0.9/modules/feature_selection.html
“警告当心不要对分类问题使用回归评分功能。”

我正在尝试找到回归问题的最佳功能,并使用f_regression作为评分功能。但是这非常耗费内存,我的8GB机器挂起,最后出现内存错误。

对于相同的问题,我已经将Chi2用作得分函数,并且它的工作速度非常快。想知道警告的反面是否成立?如果不能,我可以使用Chi2作为回归问题的评分函数吗?

最佳答案

χ²测试建立了n_classes乘以n_features的列联表。在回归模型中,没有n_classes的概念。使其起作用的唯一方法是对y值进行装箱,进行特征选择,然后在原始y和简化的特征集上训练回归模型。 scikit-learn不支持此功能,因此您必须自己对其进行编程。

关于machine-learning - 卡方作为回归的得分函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19951490/

10-12 21:53
查看更多