它们都是成本函数吗?像这样,您在评估错误时会同时看待两者还是将其单独衡量?对logloss错误感到困惑,并且很难找到有关它的信息。

最佳答案

假设您已经在一些训练数据xtr,ytr上训练了一些分类器,并且获得了一些适合的分类器m。现在,对于某些x,y,采用分类器的结果ŷ=ŷm(x)。


log loss是一个使用y和ŷ的函数,并输出分类器对数据的处理程度。
OOB (out of bag)只是意味着您不会将用于训练的数据集xtr,ytr用作用于评估性能的数据集x,y。而是意味着x,y是xte,yte,这是您未进行训练的某些数据集(可能专门用于此目的)。


因此,这两个概念是正交的:


有了拟合分类器和OOB数据集,您可以使用或不使用对数丢失。
您可以在OOB数据集或原始火车数据集上测量对数损失(但是,在后一种情况下,您应该非常谨慎地解释结果-这是对预测变量实际运行情况的可怕估计)。

10-06 03:10