如果你不知道模因是什么意思,你可以读这篇文章
readwriteweb
我的问题是如何创建一个meme算法,我有一个网站,聚集了成千上万的博客文章,我想找出最常被谈论的故事。
请看上面这篇文章的引文
“模因聚合试图减少
关于信噪比
找出最常说的是什么
关于新闻(因此,希望,
最重要的)。”
有人知道怎么做吗?,
他们有什么简单的教程吗?
因为我数学不太好。
谢谢
最佳答案
做这种事没有“正确”的方法。实现这一点的方法有很多种,您需要选择一种可以实现/运行并以您喜欢的方式运行的方法。从一些你能理解的简单的事情开始,然后从那里开始。
例如:
Ben Reeves建议使用“用特定的标签/总容量的博客帖子数”和pagerank方法如果这些选择主题的方式适合您,请继续。
这里还有一些其他的建议,
您可以根据宿主网站的流行程度为文章添加权重例如,《纽约时报》上发表的文章可能会被认为比乔·希姆斯博客上的文章更受欢迎,而且应该获得更多的权重。这类似于页面排名方法,在实践中可能没有什么区别。
你可以添加一个时间因素,所以一个主题的帖子发布的速度有多快很重要。例如,如果主题B从上周起有30篇文章,而主题C从今天起有10篇文章,你可能会认为主题C更受欢迎。如果主题d在过去一年中每周有2个帖子呢?在最后一个小时里有5篇文章的主题E怎么样?