我有以下格式的数据:
X,Y,sim(X,Y)
也就是说,三元组的列表包括:
X,对象的名称;
Y,另一个对象的名称;
sim(X,Y),表示两个对象之间距离的实数。
现在,我想对此数据应用一些无监督的聚类算法。
我想到了Weka,但也很乐意考虑其他选择。
最佳答案
有很多算法可用于相似度矩阵:
层次链接聚类
数据库扫描
光学
亲和力传播
光谱聚类
仅举几个。至于软件,我更喜欢ELKI,它具有更多的集群选择。
关于machine-learning - 使用Weka进行无监督群集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/23698833/