本文重点 K-均值是聚类算法之一,该算法接受一个没有标签的数据集,然后将数据聚类成不同的簇。 k-均值运行原理 K-均值是一个迭代算法,假设我们想要将数据聚类成k个组,其方法为: 下面是一个二聚类示例: 随机初始样本点 所有样本找距离最近的聚类中心 找到之后就分成了两种颜色,一种红,一种蓝,然后重新计算新的红色的聚类中心,和新的蓝色的聚类中心,继续这个过程