深度学习简介
机器学习是实现人工智能的一种途径,深度学习是机器学习的一个子集
深度学习相比于机器学习,少了‘手动特征提取’部分,交给网络来处理
深度学习流程:数据输入–训练模型(在数据中学习)–输出预测
- 机器学习:输入-特征工程-训练分类/回归器–输出
- 深度学习:输入 - 算法(分类器)–输出
图像处理、语音识别、机器翻译、拍照翻译、自动驾驶
内容:深度学习框架TensorFlow应用,深度神经网络
深度学习发展关键点
1989:反向传播(计算机硬件资源不够给力)
2012:李飞飞imageNet数据集,举行竞赛 ,首次使用深度学习
2019:transformer
计算机视觉(CV)
1,定义
计算机视觉是指用摄像机和电脑及其他相关设备,对生物视觉的一种模拟。主要任务是让计算机理解图片或者视频中的内容,就像人类和许多其他生物每天所做的那样。
2,任务
任务拆分:让计算机理解图片中的
- 场景(办公室,客厅等)
- 物体(动物,人等)
- 定位物体在图像中的位置(物体的大小,边界等)
- 物体间的关系或行为(对话,比赛,吵架等),以及图像表达的意义(悲伤的,喜庆的等)
OpenCv主要是前期工作,对图片处理
计算机视觉三大经典任务:图像分类、目标检测、图像分割
- 图像分类:区分是猫是狗
- 目标检测:关注特点的物体目标,获取这一目标的类别信息和位置信息
- 图像分割:如无人驾驶中对道路和非道路的分割
3,历史
2012年前 – 基于传统方法
2012年后 – DL在CV遍地开花