我正在使用资源管理器功能进行分类。我的.arff数据文件具有10个数字和二进制值功能; (只有实例ID是标称的)。我有16个实例。我要使用的是朴素贝叶斯,但我无法解释结果,有人知道如何从朴素贝叶斯分类中解释结果吗?

最佳答案

朴素贝叶斯(Naive Bayes)没有选择任何重要功能。如您所述,训练朴素贝叶斯分类器的结果是每个特征的均值和方差。将新样本分为“是”或“否”是基于样本特征的值是否与“是”或“否”的训练特征的均值和方差最匹配。

您可以使用其他算法来找到最有用的属性。在这种情况下,您可能要使用决策树分类器,例如WEKA中的J48(这是C4.5 decision tree algorithm的开源实现)。结果决策树中的第一个节点会告诉您哪个功能具有最大的预测能力。

甚至更好(如另一篇文章中的Rushdi Shams所述); Weka的资源管理器提供了专用的构建选项,可以在数据集中找到最有用的属性。这些选项可在Select attributes选项卡下找到。

08-25 09:03