本文重点

K-均值是聚类算法之一,该算法接受一个没有标签的数据集,然后将数据聚类成不同的簇。

k-均值运行原理

K-均值是一个迭代算法,假设我们想要将数据聚类成k个组,其方法为:

下面是一个二聚类示例:

每天五分钟机器学习:常用的聚类算法——k均值的运行原理和实现-LMLPHP

随机初始样本点

每天五分钟机器学习:常用的聚类算法——k均值的运行原理和实现-LMLPHP

所有样本找距离最近的聚类中心

每天五分钟机器学习:常用的聚类算法——k均值的运行原理和实现-LMLPHP

找到之后就分成了两种颜色,一种红,一种蓝,然后重新计算新的红色的聚类中心,和新的蓝色的聚类中心,继续这个过程

11-28 10:35