11 K-Means 原理及案例

非监督学习

  1. unsupervised learning (非监督学习) ,只有特征值,没有目标值
  2. 聚类: 主要方法 - k-means (K - 需要分成的类别数)
    11 K-Means 原理及案例-LMLPHP

K-Means步骤

  1. 随机设置K个特征空间内的点作为初始的聚类中心 (红,绿,蓝) k=3 (给定)
    11 K-Means 原理及案例-LMLPHP

  2. 对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类
    中心点作为标记类别,形成3个族群
    11 K-Means 原理及案例-LMLPHP

  3. 分别计算这3个族群的平均值,把三个平均值与之前的三个旧中心进行比较。如果相同则结束聚类,如果不相同,把这三个平均点当做新的中心点,重复第二步。
    11 K-Means 原理及案例-LMLPHP

Kmeans性能评估指标

11 K-Means 原理及案例-LMLPHP

注:对于每个点

05-11 18:39