在Python sklearn KMeans(see documentation)中,我想知道将形状(n,n_features)的ndarray
传递给init
参数时内部会发生什么,当n<n_clusters
是否会丢弃给定的质心,而只是启动kmeans ++初始化(这是init
参数的默认选择)? (PDF paper kmeans++)(How does Kmeans++ work)
它是否考虑给定的质心并使用kmeans ++相应地填充其余的质心?
它是否考虑给定的质心并使用随机值填充其余的质心?
我没想到在这种情况下该方法不会返回任何警告。这就是为什么我需要知道它是如何管理的。
最佳答案
如果您给它不匹配的init
,它将调整群集的数量,如您从source所见。这没有记录,我认为这是一个错误。
我建议修复它。
关于python - sklearn.cluster.KMeans如何处理缺少质心(可用质心小于n_clusters)的init ndarray参数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30169378/