非监督学习

非监督学习没有历史样本数据和标签,直接对数据分析或得结果。

k-means 使用

>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
... [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1., 2.],
[ 4., 2.]])

k-means重要参数

  1. n_clusters 估计聚类的数量
  2. n_init k-means算法基于不同中心点运行的次数
  3. max_tier k-means一次运行的迭代次数,默认300,通常不到300就结束了
05-21 23:38