使用群集算法时,始终必须指定关闭参数。
我目前正在使用scikit-learn的聚集聚类,我能看到的唯一关闭参数是集群的数量。

agg_clust = AgglomerativeClustering(n_clusters=N)
y_pred = agg_clust.fit_predict(matrix)

但我想找到一种算法,在这里你可以指定簇内元素的最大距离,而不是簇的数目。
因此,该算法将简单地聚集簇,直到达到最大距离。
有什么建议吗?

最佳答案

您要寻找的是在scipy.cluster.hierarchy中实现的,请参见here
所以你可以这样做:

from scipy.cluster.hierarchy import linkage, fcluster
y_pred = fcluster(linkage(matrix), t, criterion='distance')

# or more direct way
from scipy.cluster.hierarchy import fclusterdata
y_pred = fclusterdata(matrix, t, criterion='distance')

关于python - 在聚集集群中指定最大距离(Scikit Learn),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41824968/

10-12 23:15