Mahout的中文含义:象夫
Mahout起源
2008年成为Lucene的子顷目,Lucene作为搜索引擎顷目,
存在很多文本数据分析和挖掘的需求(例如文本重复判断,文本自动分类等等),
导致Lucene顷目中部分开发者转向机器学习领域研究算法,最终这些机器学习算法形成最初的Mahout
吸收开源协同过滤算法顷目Taste
2010年成为Apache顶级顷目
常见算法的Map-Reduce化
Mahout的特点
Mahout的主要目的是实现可伸缩的机器学习算法(就是算法的M-R化)
但也不一定要求基亍Hadoop平台,核心库中某些非分布式的算法也具有很好的性能
目标是帮助开发人员快速建立具有机器智能的应用程序,目前比较成熟和活跃的主要包括
1 频繁模式挖掘
2 聚类算法
3 分类器
4 推荐系统
5 频繁子顷挖掘
Mahout目前支持和研究中的算法列表
https://cwiki.apache.org/confluence/display/MAHOUT/Algorithms