我对BIC图与GMM中组件的数量感到非常困惑。 Python文档说的越低越好,但是我在一些网站上读到,正确的簇数是局部最大值的第一位置!

谁能详细说明一下,Python是否使用其他方程式,而负号与BIC分数方程式相乘?

最佳答案

似乎BIC定义在不同来源上有所变化。这是bic方法的源代码:

    def bic(self, X):
    . . .
    return (-2 * self.score(X) * X.shape[0] +
            self._n_parameters() * np.log(X.shape[0]))


随着模型复杂度的增加,bic值增加,而随着似然性的增加,bic减少。因此,越低越好。
此定义与related the wikipedia page上的公式相同。

另外,我在Wikipedia页面上发现了此注释,该注释可能解释了为什么此定义不符合您的预期:


  注意:Claeskens和Hjort(2008)定义的AIC,AICc和BIC与本文和大多数其他标准参考文献中所定义的相反。

关于python - BIC(贝叶斯信息准则)应该更低还是更高,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51144580/

10-12 17:51