我有六个以上的不同表,具有300多个功能(属性)。现在,我对为模型构建选择特征的正确方法有些困惑。我考虑两个过程


一对一地选择属性,并计算该属性对于输出的重要性,并将其添加到数据集市。
从所有表格中获取所有功能,并计算它们的相关性和重要性,并删除次要功能。

最佳答案

300个功能对于您的模型构建过程来说太多了。

您可以使用xgboost和random forest之类的算法,因为它们具有以下功能:
查找功能的重要性。

您可以根据特征的重要性对特征进行排序,然后删除重要性不高的特征,这将使模型的复杂性降低。

关于machine-learning - 特征选择的最佳方法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54784197/

10-12 23:07
查看更多