我想知道stumbleupon如何为用户推荐文章?
它是使用神经网络还是某种机器学习算法,或者实际上是根据用户的“喜好”来推荐文章,还是只是根据兴趣区域中的标签来推荐文章?我说的是使用标签,例如使用基于项目的协作式过滤等?
最佳答案
首先,我对S/U的推荐引擎不了解。我所知道的是,过去几年来我一直在关注该主题,并研究了可公开获取的资源(包括StumbleUpon在公司网站和博客上的帖子),当然还从StumbleUpon的用户那里学到了东西。
我还没有找到一个权威的或其他来源的消息来源,几乎可以说“这是S/U推荐引擎的工作原理”,尽管考虑到这可以说是有史以来最成功的推荐引擎-统计数字是疯狂的, S/U accounts for over half of all referrals on the Internet,并且比facebook多得多,尽管facebook拥有的注册用户只有一小部分(8亿对1500万);更重要的是,S/U并不是真正具有推荐引擎的网站,例如Amazon.com,而是该网站本身就是一个推荐引擎-在相当少数的构建团队中,有大量的讨论和八卦推荐引擎,如果您对此进行筛选,我认为可以可靠地区分所使用算法的类型,提供给它们的数据源以及这些数据在工作数据流中的连接方式。
下面的描述引用了我的底部图表。数据流中的每个步骤都用罗马数字表示。我的描述是向后进行的-从将URL交付给用户的位置开始,因此在实际使用中,最后执行步骤I,首先执行步骤V。
鲑鱼色椭圆形 =>数据源
浅蓝色矩形 =>预测算法
I.向S/U用户推荐的网页是多步骤流程中的最后一步
二。 StumbleUpon Recommendation Engine提供了来自三个不同来源的数据(网页):
兴趣(用户已将其表示为兴趣的主题,
可通过单击上方的“设置”标签来查看/修订
已登录用户页面的右上角);
三,这些来源依次是StumbleUpon预测算法返回的结果(“相似用户”指的是由“聚类算法”(可能是k均值)确定的同一聚类中的用户)。
IV。馈送到集群引擎进行训练的数据包括带有用户评分的网页
V.此数据集(由StumbleUpon用户评分的网页)还用于训练监督分类器(例如,多层感知器,支持向量机)。该监督分类器的输出是应用于网页的分类标签,而不是尚未由用户评分。
我发现在其他推荐系统中讨论SU的推荐引擎的唯一最佳资源是this BetaBeat Post。
关于machine-learning - StumbleUpon推荐引擎的体系结构和基本组件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7471018/