使用群集算法时,始终必须指定关闭参数。
我目前正在使用scikit-learn的聚集聚类,我能看到的唯一关闭参数是集群的数量。
agg_clust = AgglomerativeClustering(n_clusters=N)
y_pred = agg_clust.fit_predict(matrix)
但我想找到一种算法,在这里你可以指定簇内元素的最大距离,而不是簇的数目。
因此,该算法将简单地聚集簇,直到达到最大距离。
有什么建议吗?
最佳答案
您要寻找的是在scipy.cluster.hierarchy中实现的,请参见here。
所以你可以这样做:
from scipy.cluster.hierarchy import linkage, fcluster
y_pred = fcluster(linkage(matrix), t, criterion='distance')
# or more direct way
from scipy.cluster.hierarchy import fclusterdata
y_pred = fclusterdata(matrix, t, criterion='distance')
关于python - 在聚集集群中指定最大距离(Scikit Learn),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41824968/