- 应用领域
medical records:医疗记录,身体健康学习一下
web :机器学会网页排序、垃圾邮件、推荐
biology:对基因、dna 学习
工程:无人机、邮件系统 - 机器学习定义
Arthur Samuel:使 机器学会学习
Tom Mitchell:E-experience(经验) T-task(任务) P-performance(性能)
2.1 两大方面
supervised learning:我们教计算机学习
unsupervised learning:计算机自己学习
Andrew NG:(大学)只给工具(知识),他教使用工具(知识) - supervised learning
3.1 regression:predict continuous valued output
price 为实数,标量,连续值
在技术上,可以圆整,离散值
画一条直线,曲线
3.2 Breast cancer
classification: discrete valued output(0 or 1)
离散值
3.2.1 一种特征
3.2.2 两种特征
3.2.3 infinite features
SVM - unsupervised learning
聚类算法:把一些没有分类数据进行分类。
分簇 cluster 没有标签
eg: google news, cocktail Party problem,基因组 DNA微阵列,computer cluaters, 社交网络, 市场, 天文数据分析
cocktail Party problem全过程:输入混合声音-鸡尾酒算法-输出分开声音