模式识别
模式识别就是用计算的方法根据样本的特征将样本划分到一定的类别中去。模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读,把环境与客体统称为“模式”。模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向,研究人类模式识别的机理以及有效的计算方法。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
基于监督学习的模式识别系统由4大部分组成,即待识别对象、预处理、特征提取和分类识别,如下图所示。
1. 待识别对象
待识别对象由数据采集而来,利用各种传感器把将待识别对象的各种信息转换为计算机可以接受模拟信号。
2. 预处理
待识别对象一般从物理界中利用传感器采集而来,其中包含了其他无关信息和噪声。因此提取特征之前,需消除无关信息和进行噪声的预处理。只留下与被研究对象的性质和采用的识别方法密切相关的特征。
3. 特征提取
从输入数据的许多特征中寻找出最有效的特征,得到最能反映分类本质的特征,从特征集合中挑选一组最具统计意义的特征,达到降维效果,以降低后续处理过程的难度。
4. 分类识别
基于特征提取,就可以分类识别。因此,对分类识别需要建立模型训练库。根据模型建立判别分类函数,这一过程是由机器来实现的,称为学习过程。然后对一个未知的新对象分析它的特征,决定它属于哪一类,这是一种监督分类的方法。
具体步骤是根据特征建立训练集,已知训练集里每个点的所属类别,寻求某种判别函数或判别准则,设计判决函数模型,根据训练集中的样品确定模型中的参数,便可将这模型用于判别,利用判别函数或判别准则去判别未知类别的点应该属于哪一个类。在模式识别学科中,一般把这个过程称为训练与学习的过程。