机器学习(Machine Learning)是一门数据驱动(Data-driven)的科学,所谓的 数据驱动 是指需要使用样本数据训练模型(train model),然后再使用训练好的模型预测新的数据;根据样本数据(一般也称为训练数据(train data))携带标签(labels)与否,做以下分类:
- 监督学习(supervised learning):训练数据需要标签(labels),监督学习分为 分类问题 和 回归问题 两种;常见的监督学习方法有:K近邻算法、线性回归、logistic回归、SVM等;
- 无监督学习(unsupervised learning):训练数据不需要标签,无监督学习强调通过对数据内在特征的挖掘找到样本间的关系;无监督学习主要是 聚类问题 和 降维问题 ;常见的无监督学习方法有:K-means、最大期望算法、PCA;
- 半监督学习(semi supervised learning):只有部分训练数据包含标签,通常是大量未标记的数据和少量标记的数据;
- 半监督学习(self-supervised learning):自监督学习和无监督学习一样都不需要训练数据额外的标签信息,但是自监督学习需要通过辅助任务(pretext)在大规模无监督数据中自动构造监督信息,通过得到的标签,就可以类似有监督学习一样进行训练;半监督学习是弱监督学习的一种。
- 弱监督学习(weakly supervised learning):弱监督学习分为:不完全监督(Incomplete supervision),不确切监督(Inexact supervision),不精确监督(Inaccurate supervision)三种:
- 不完全监督(Incomplete supervision):训练数据中只有一部分数据被给了标签,即半监督学习,
- 不确切监督(Inexact supervision):训练数据只给出了粗粒度标签,
- 不精确监督(Inaccurate supervision):给出的标签不总是正确的。
- 强化学习(reinforcement learning):算法通过设计的奖励,不断试错进而提高模型的效果。