一. 什么是机器学习
1. 概念
机器学习(Machine Learning,ML)是一门多领域的交叉学科,涉及概率论、统计学、线性代数、算法等多门学科。
它专门研究计算机如何模拟和学习人
的行为,以获取新的知识或技能,重新组织
已有的知识结构使之不断完善自身的性能。
机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
2. 机器学习算法分类
机器学习的算法分为两大类:监督学习和无监督学习。
监督学习
非监督学习
二. 利用预测模型解决问题的步骤
预测模型
利用机器学习的预测模型来解决问题共有六个基本步骤,如图:
一旦明白了如何使用Python平台来完成机器学习的任务,就可以在不同的项目中重复使用这种方法解决问题。
三. 机器学习的Python生态圈
Python是一种功能强大且灵活的编程语言,特别适用于机器学习,这得益于其可读性、一致性和健壮的数据科学库生态系统。
简单来说
其中
需要指出的是,由于scikit-learn本身不支持深度学习,也不支持GPU加速,因此scikit-learn对于多层感知器(MLP)神经网络的实现并不适合处理大规模问题
。(scikit-learn对MLP的支持在0.18版之后增加)