对于推荐引擎,这些技术(矩阵分解:ALS,Pearson或余弦相关)的优缺点是什么,以及我们如何拒绝使用哪种技术。
最佳答案
使用皮尔逊相关性的协同过滤存在一些问题。我将列出一些大的:
可扩展性
随着数据库的增长,计算用户之间的皮尔逊相关性将花费越来越长的时间。由于您必须计算每个用户之间的相关性,因此相关性将成倍增长。
数据稀疏
对于大多数推荐引擎来说,这是一个大问题。如果您有很多用户,并且有很多商品且评论很少,则由于很难计算用户之间的相关性,因此很难生成推荐。
冷启动问题
从技术上讲,每种方法都会遇到此问题,但是矩阵分解比协作过滤器可以更好地处理此问题。冷启动问题基本上意味着您没有或几乎没有任何有关用户的数据。使用协作过滤器时,您无法解决此问题。期。
您可以使用替代技术来解决此问题,即基于内容的过滤。
确定应该使用哪种方法可能很困难。矩阵分解优于传统的基于用户和基于项目的协作过滤,但是您必须确定它是否最适合您的模型。
如果您没有稀疏的数据库,那么协作过滤器会很好地工作,但是矩阵分解方法也可以。
这是一些有趣的网站,其中包含有关这些方法的数据。最后,由您或您的团队决定哪种方法最有效。
矩阵分解示例:http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/
内容和协作过滤:http://recommender-systems.org/
随意询问是否还不够清楚!
关于machine-learning - 协同过滤-矩阵分解与皮尔逊相关,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36936578/