它记录在http://scikit-learn.org/0.9/modules/feature_selection.html中
“警告当心不要对分类问题使用回归评分功能。”
我正在尝试找到回归问题的最佳功能,并使用f_regression作为评分功能。但是这非常耗费内存,我的8GB机器挂起,最后出现内存错误。
对于相同的问题,我已经将Chi2用作得分函数,并且它的工作速度非常快。想知道警告的反面是否成立?如果不能,我可以使用Chi2作为回归问题的评分函数吗?
最佳答案
χ²测试建立了n_classes
乘以n_features
的列联表。在回归模型中,没有n_classes
的概念。使其起作用的唯一方法是对y
值进行装箱,进行特征选择,然后在原始y
和简化的特征集上训练回归模型。 scikit-learn不支持此功能,因此您必须自己对其进行编程。
关于machine-learning - 卡方作为回归的得分函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19951490/