我有以下格式的数据:

X,Y,sim(X,Y)


也就是说,三元组的列表包括:


X,对象的名称;
Y,另一个对象的名称;
sim(X,Y),表示两个对象之间距离的实数。


现在,我想对此数据应用一些无监督的聚类算法。
我想到了Weka,但也很乐意考虑其他选择。

最佳答案

有很多算法可用于相似度矩阵:


层次链接聚类
数据库扫描
光学
亲和力传播
光谱聚类


仅举几个。至于软件,我更喜欢ELKI,它具有更多的集群选择。

关于machine-learning - 使用Weka进行无监督群集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/23698833/

10-12 21:32