我正在运行SciKit Learn的Decision Trees算法,我想获得Feature_importance向量以及特征名称,以便我可以确定哪些特征在标注过程中占主导地位。你可以帮帮我吗?谢谢你。

最佳答案

假设您有一些样本作为pandas.DataFrame的行:

from pandas import DataFrame
features = DataFrame({'f1': (1, 2, 2, 2), 'f2': (1, 1, 1, 1), 'f3': (3, 3, 1, 1)})
labels = ('a', 'a', 'b', 'b')

然后使用树或森林分类器:
from sklearn.tree import DecisionTreeClassifier
classifier = DecisionTreeClassifier()
classifier.fit(features, labels)

然后,重要性应与框架列匹配:
for name, importance in zip(features.columns, classifier.feature_importances_):
    print(name, importance)

# f1 0.0
# f2 0.0
# f3 1.0

关于python - SciKit的决策树中的Feature_importance向量以及特征名称,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40159161/

10-12 19:51