学习北邮鲁鹏老师的计算机视觉计算机视觉课程的笔记小结
计算机视觉
在计算机视觉中,主要的任务有
- 图像处理(像素级别)。噪声处理,形态学处理,轮廓处理。
- 特征工程。像素级别的几何特征:haar角点。统计特征:HOG,sift。
- 图像分割。算法:mean-shift,最小割。
- 图像分类。场景分类。算法:svm/决策树/xgboost
- 图像检测。人脸检测(HAAR)、行人检测(HOG)。
- 图像识别。人脸识别,车牌识别。
一边来说,对于一个工程任务,比如车牌检测,要分层pipeline处理。
- 找到ROI感兴趣的区域。分析ROI的几何、形态、色彩特征,进行图像处理。
- 特征提取。
- 有监督训练分类器,降低错误率。根据向量特征及其label 训练图像分类器svm。
- OCR识别。
SLAM
SLAM方面的话,pipline 是
- 收集两个视角的图像。
- 图像特征提取。sift特征或orb特征。
- 点匹配。暴力或flann算法匹配。
- 计算相机位姿计算和特征点3D坐标。算法:归一化八点法(数值稳定)。
- 收集第三个视角的图像。
- PnP计算相机位姿。PnP是已知3D坐标,不同于八点法。
机器学习
kaggle中大部分使用的最优分类算法还是 xgboost,gbdt集成决策树的一种。