我正在构建一个Java Web服务,用于根据在twits中使用的单词的频率在特定位置(纬度,经度)查找热门话题。

我正在使用twitter4j api来获取twit,并且可以使用它们的位置对其进行过滤。
有人可以帮助我,告诉我如何处理数据并获得热门话题吗?

我将非常感谢。

最佳答案

我建议您研究“概率潜在语义索引”。您可以为此使用“ topicmodels”包。

该视频可能对您有用:Video on Probabilistic latent semantic indexing

09-11 18:08