我想知道如何使用Java中的树冠集群对输入进行集群吗?
1 access 375
1 addition 375
1 advance 375
1 answered 375
1 applied 375
1 approximate 375
1 evil 375
1 hiway 375
1 home 375
1 hope 375
1 hotmail 375
3 town 375
4 forum 375
4 good 375
4 reig 375
5 plot 375
单词的频率在第一列中。第二列是单词,第三列是单词总数。
冠层分类怎么做?并想知道什么是阈值?
最佳答案
机盖聚类应用于矢量和完整文本,而不是单个单词。
您认为集群是什么?除非您对集群的外观有清楚的了解,否则永远不会弄清楚什么是正确的算法。
那么,您是否期望像这样的集群:
1 access 375
1 addition 375
1 advance 375
1 answered 375
1 applied 375
1 approximate 375
(以a开头的单词)?这对您有用吗?
聚类算法不是魔术工具。您需要仔细选择和配置它们,以产生您感兴趣的结果。