非监督学习
非监督学习没有历史样本数据和标签,直接对数据分析或得结果。
k-means 使用
>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
... [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1., 2.],
[ 4., 2.]])
k-means重要参数
- n_clusters 估计聚类的数量
- n_init k-means算法基于不同中心点运行的次数
- max_tier k-means一次运行的迭代次数,默认300,通常不到300就结束了