我正在以一种简单的方式在 Hadoop 上构建一个推荐系统,您能否就如何构建这个推荐系统给我一个意见。
我想使用 Apache pig 或 Apache mahout。
在我的数据集中我有
book_id,name,publisher
user_id,username
book_id,user_id,rating
我的数据是 c.s.v 格式
所以请您建议我使用哪种技术来生成基于项目和基于用户的推荐系统。
最佳答案
Apache Mahout 将为您提供一个基于协同过滤算法的现成推荐引擎。
使用 Pig,您必须自己实现这些算法 - 在 Pig Latin 中,这可能是一项相当复杂的任务。
关于hadoop - 使用 Pig 或 mahout 的推荐系统,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21968312/