我使用 Google Bigquery 训练了一个 KMEANS 聚类模型,它在模型的评估选项卡中为我提供了这些指标。我的问题是我们是否试图最大化或最小化 Davies-Bouldin 指数和均方距离?
最佳答案
Davies-Bouldin index 是一种验证指标,通常用于评估要使用的最佳集群数量。它被定义为聚类散布和聚类分离之间的比率,较低的值意味着聚类更好。
关于第二个度量,均方距离引用了集群内方差,我们希望将其最小化,因为 WCSS(集群内平方和)将 maximize the distance between clusters 。
关于machine-learning - Davies-Bouldin 指数越高或越低得分越好,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59279056/