11 K-Means 原理及案例
非监督学习
- unsupervised learning (非监督学习) ,只有特征值,没有目标值
- 聚类: 主要方法 - k-means (K - 需要分成的类别数)
K-Means步骤
随机设置K个特征空间内的点作为初始的聚类中心 (红,绿,蓝) k=3 (给定)
对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类
中心点作为标记类别,形成3个族群分别计算这3个族群的平均值,把三个平均值与之前的三个旧中心进行比较。如果相同则结束聚类,如果不相同,把这三个平均点当做新的中心点,重复第二步。
Kmeans性能评估指标
注:对于每个点