我想根据人们的兴趣把他们分成几个小组。例如,喜欢机器学习和图表的人可以被安排在一个小组里,对数学和经济学等有兴趣的人可以被安排在另一个小组里。
该算法应该能够根据人们的兴趣来决定哪些人拥有最匹配的兴趣,并创建集群,还应该能够输出特定人所在的组中其他人的信息。
最佳答案
这听起来不像是一个特别困难的聚类问题,任何现成的聚类算法都可能工作得很好。如果你知道你想要多少个聚类,那么试试k-means或k-medoid聚类如果您不知道有多少个集群,那么尝试聚合集群。
问题的难点在于特征。你提到“兴趣”可以用作要进行集群的特性,但是特性工程和选择总是需要一些尝试和错误。