本文主要是介绍The Definition of Pattern Recognition,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
模式识别: “对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。” –模式识别(西奥多里德斯 等著 )
模式识别方法的应用:
• 网络搜索
• 字符识别:包括印刷体字符的识别;手写体字符的识别、各种OCR设备例如信函
分拣、文件处理、各种书写输入板。
• 指纹识别、人脸识别。
• 语声识别,电话号码自动查询,机器故障判断。
• 医疗诊断:心电图,脑电图,染色体,癌细胞识别,疾病诊断等等。
模式识别的过程可以抽象地表示为
“x->h(x)->y”
• 其中:
• x代表原始信息(数据)
• h(x)代表模式识别系统
• y代表输出(例如:类别)
• 作为一个具体的研究领域,模式识别关注的是如何利用(或是设计)计算机算法寻求最优的h(x)。
• 从计算机的角度来看,h(x)可以通过一个计算机程序实现(例如一组If…Then语句)。因此,模式识别的研究可以
理解为“寻找可以获得最优程序的计算机算法”。
以模式识别中最具代表性的分类问题为例,模式识别系统又可划分为以下几个子模块
– 传感器(信息获取)
– 特征提取器(预处理)
– 分类器(识别)
– 后处理器(最终决策)
• 其⼯工作流程为:
同样以分类问题为例,假设我们要针对一个应用领域(例如指纹识别)设计一个模式识别系统,
需要解决以下几个关键的技术问题:
– 如何采集数据?
– 如何对数据进⾏行预处理(特征提取)?
– 如何利⽤用经过预处理的数据,获得好的分类器?
– 如何对分类器的输出作后期处理?
– 如何评价⼀一个模式识别的系统,以确定它真实有效?
分类和聚类是模式识别领域两个最重要的研究领域;其中,⼜又以分类为重中之重。
基本概念和常用术语
模式(pattern):广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式。
特征(feature):描述事物某些物理、结构等方面信息的度量、属性。例如长度、重量、均值、方差等。
样本(sample):即一个事物在某些特征上的取值的“组合”,有时也被称为模式(paJern)、例子(example)
在科学研究或工程实践中,往往可以把模式识别系统的输入整合为一个nxd维的矩阵,其中n为样本数,d为特征数;
特征矢量:在当前的主流模式识别文献中,样本往往被表示为一个矢量,每一维对应一个特征,这个矢量就叫特征
矢量(为便于记忆,可粗略认为特征矢量=样本)。
特征空间:一个由d个特征表示的样本可视为在一个d维欧式空间中的一个点,这个空间的每一维都对应了一个特征,
因此也叫特征空间。
假设空间(hypothesis space) :一个模式识别系统h(x)描述了其输入和输出之间的关系,这种关系称为假设(hypothesis)。所谓空间,从数学意义上讲就是一个集合。因此,一个模式识别问题的假设空间,就是指所有可能的假设的集合。
分类(classifica-on) :把某一事物判定为已被预先定义好的一个类别的过程。
聚类(clustering) :将事物的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇(cluster)是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
分类与聚类的本质差别在于“类别”是否已经预先定义好。
训练(training):根据一组训练样本(trainingsamples),获取一个尽可能好的模式识别系统(尤其是分类器)的过程。从另一个角度来说,“训练”可视为在假设空间中寻找最佳假设h(x)的过程。
测试(testing):针对一组测试样本(testingsamples),评价/检验一个模式识别系统性能的过程。
有监督学习(supervised learning):利用一组已知类别的样本训练分类器,使其达到所要求性能的过程,也称为监督训练或有监督学习。
无监督学习(unsupervised learning):若训练样本不带有类别信息,就是无监督学习。
泛化能力(generalization ability):一个模式识别系统对新样本的适应能力。我们希望一个模式识别系统经过训练,能获得隐含在数据背后的规律,对具有同一规律的样本,即使以前从未见过,也能给出正确(或合适)的输出,该能力称为泛化能力。(形象地说,就是“举一反三”的能力)
以分类问题为例,在设计一个模式识别系统的过程中:
• 我们首先需要有一组训练样本(模式),每一个样本由若干个特征描述,表示为一个特征矢量的形式,并可视为在特征中间中的一个点。
• 然后,我们需要利用有监督学习的方法训练一个模式识别系统。这个过程可视为在假设空间中寻找一个最符合我们要求的假设。
• 最后,我们需要针对一组测试样本,检验训练好的模式识别系统的泛化能力。
这篇关于The Definition of Pattern Recognition的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!