我想知道如何使用Java中的树冠集群对输入进行集群吗?

       1 access 375
       1 addition 375
       1 advance 375
       1 answered 375
       1 applied 375
       1 approximate 375
       1 evil 375

       1 hiway 375
       1 home 375
       1 hope 375
       1 hotmail 375
       3 town 375
       4 forum 375
       4 good 375
       4 reig 375
       5 plot 375


单词的频率在第一列中。第二列是单词,第三列是单词总数。

冠层分类怎么做?并想知道什么是阈值?

最佳答案

机盖聚类应用于矢量和完整文本,而不是单个单词。

您认为集群是什么?除非您对集群的外观有清楚的了解,否则永远不会弄清楚什么是正确的算法。

那么,您是否期望像这样的集群:

   1 access 375
   1 addition 375
   1 advance 375
   1 answered 375
   1 applied 375
   1 approximate 375


(以a开头的单词)?这对您有用吗?

聚类算法不是魔术工具。您需要仔细选择和配置它们,以产生您感兴趣的结果。

08-18 13:18