一、介绍
  • OpenCV是计算机视觉领域应用最广泛的开源工具包,基于C/C++,支持Linux/Windows/MacOS/Android/iOS,并提供了Python,Matlab和Java等语言的接口,因为其丰富的接口,优秀的性能和商业友好的使用许可,不管是学术界还是业界中都非常受欢迎。OpenCV最早源于Intel公司1998年的一个研究项目,当时在Intel从事计算机视觉的工程师盖瑞·布拉德斯基(Gary Bradski)访问一些大学和研究组时发现学生之间实现计算机视觉算法用的都是各自实验室里的内部代码或者库,这样新来实验室的学生就能基于前人写的基本函数快速上手进行研究。于是OpenCV旨在提供一个用于计算机视觉的科研和商业应用的高性能通用库。
  • 和Python一样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。
  1. core:核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操作。
  2. imgproc:图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。
  3. highgui:提供了用户界面和文件读取的基本函数,比如图像显示窗口的生成和控制,图像/视频文件的IO等。
  • video:用于视频分析的常用功能,比如光流法(Optical Flow)和目标跟踪等。
  • calib3d:三维重建,立体视觉和相机标定等的相关功能。
  • features2d:二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,比如ORB特征。
  • object:目标检测模块,包含级联分类和Latent SVM
  • ml:机器学习算法模块,包含一些视觉中最常用的传统机器学习算法。
  • flann:最近邻算法库,Fast Library for Approximate
  • Nearest Neighbors,用于在多维空间进行聚类和检索,经常和关键点匹配搭配使用。
  • gpu:包含了一些gpu加速的接口,底层的加速是CUDA实现。
  • photo:计算摄像学(Computational Photography)相关的接口,当然这只是个名字,其实只有图像修复和降噪而已。
  • stitching:图像拼接模块,有了它可以自己生成全景照片。
  • nonfree:受到专利保护的一些算法,其实就是SIFT和SURF。
  • contrib:一些实验性质的算法,考虑在未来版本中加入的。
  • legacy:字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。
  • ocl:利用OpenCL并行加速的一些接口。
  • superres:超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1
  • regularization)算法
  • viz:基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。
二、常用接口
  1. 读取:
    cv2.imread(文件名,标记)读入图像,
    cv2.IMREAD_COLOR():读入彩色图像
    cv2.IMREAD_GRAYSCALE():以灰度模式读入图像
     
    import cv2
    import numpy as np
    img = cv2.imread('45.jpg',0)

  2. 建立窗口:第一个窗口名称,第二参数窗口标识
    cv2.namedWindow('WindowName', cv2.WINDOW_NORMAL)
    WINDOW_AUTOSIZE 窗口大小自动适应图片大小,并且不可手动更改。(默认模式)
    WINDOW_NORMAL 用户可以改变这个窗口大小
    WINDOW_OPENGL 窗口创建的时候会支持OpenGL

  3. 显示:
    cv2.imshow()显示图像,
    cv2.waitKey()等待键盘输入,为毫秒级

  4. 销毁窗口: 删除建立的全部窗口,括号内输入想删除的窗口名
    cv2.destroyAllWindows()

  5. 使用:
    cv2.namedWindow('WindowName',cv2.WINDOW_NORMAL)
    img = cv2.imread('xx.jpg',0)
    cv2.imshow('WindowName',img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

  6. 保存图像:
    cv2.imwrite('图片名.png',图片对象)
    img = cv2.imread('xx.jpg',0)
    cv2.imwrite('17.png',img)

  7. 监听键盘输入:cv2.waitKey(0)
    参数0表示永久监听,单位为毫秒
    指定监听时间内无键盘输入默认返回值为255,否则返回按下按键的ASCII值
    32位系统:keyValue=cv2.waitKey(sec)
    64位系统:keyValue=cv2.waitKey(sec) & oxff

05-26 07:44