在FSelector information.gain函数的函数定义中,

information.gain(公式,数据)

公式的目的是什么?我正在尝试使用该功能为分类任务进行特征选择。在我网上看到的几个示例中,公式似乎定义了类标签和数据集中的要素之间的某种关系。但是,在这种情况下,由于我正在执行分类任务,因此我不知道要素和标签之间的确切线性关系,那么公式将是什么?

最佳答案

您可以使用.告诉R您要分析类变量与数据帧中所有其他变量之间的依赖关系。例如,对于iris数据集:

> library(FSelector)
> information.gain(Species~., iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750
Petal.Length       0.9402853
Petal.Width        0.9554360


如果要仅针对变量的子集来分析交互,则可以使用显式名称:

> information.gain(Species~Sepal.Length+Sepal.Width, iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750

关于r - 在R中的information.gain中使用公式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33241638/

10-10 10:29