我正在做一个Java应用程序,在该应用程序中,我必须从Twitter搜索中获得的特定推文集合中确定什么是热门话题。在网络上搜索时,我发现该算法定义了一个主题在特定时间(即确切的时刻)被大量提及时的趋势。因此,必须进行衰减计算,以便主题经常更改。但是,我还有另一个疑问:

Twitter如何确定一条推文中的哪些特定术语应该是TT?例如,我观察到大多数TT是主题标签或专有名词。这有意义吗?还是他们分析所有单词并确定频率?

我希望有一个人可以帮助我!谢谢!

最佳答案

我认为除了Twitter以外,没有其他人知道,但是标签似乎起了很大的作用,但是还有其他因素在起作用。我认为挖掘整个文本将花费比所需更多的时间,并且会导致过多的误报。

这是Mashable的一篇有趣的文章:

http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf

-拉尔夫·温特斯

10-07 19:23
查看更多