The Definition of Pattern Recognition

2024-05-08 10:08

本文主要是介绍The Definition of Pattern Recognition,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

模式识别:      “对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。” –模式识别(西奥多里德斯 等著 )

模式识别方法的应用:

 • 网络搜索
• 字符识别:包括印刷体字符的识别;手写体字符的识别、各种OCR设备例如信函
分拣、文件处理、各种书写输入板。
• 指纹识别、人脸识别。
• 语声识别,电话号码自动查询,机器故障判断。
• 医疗诊断:心电图,脑电图,染色体,癌细胞识别,疾病诊断等等。

模式识别的过程可以抽象地表示为
                                                “x->h(x)->y”
• 其中:
• x代表原始信息(数据)
• h(x)代表模式识别系统
• y代表输出(例如:类别)

• 作为一个具体的研究领域,模式识别关注的是如何利用(或是设计)计算机算法寻求最优的h(x)。

• 从计算机的角度来看,h(x)可以通过一个计算机程序实现(例如一组If…Then语句)。因此,模式识别的研究可以
理解为“寻找可以获得最优程序的计算机算法”。


以模式识别中最具代表性的分类问题为例,模式识别系统又可划分为以下几个子模块
– 传感器(信息获取)
– 特征提取器(预处理)
– 分类器(识别)
– 后处理器(最终决策)

• 其⼯工作流程为:

同样以分类问题为例,假设我们要针对一个应用领域(例如指纹识别)设计一个模式识别系统,
需要解决以下几个关键的技术问题:
– 如何采集数据?
– 如何对数据进⾏行预处理(特征提取)?
– 如何利⽤用经过预处理的数据,获得好的分类器?
– 如何对分类器的输出作后期处理?
– 如何评价⼀一个模式识别的系统,以确定它真实有效?

分类和聚类是模式识别领域两个最重要的研究领域;其中,⼜又以分类为重中之重


基本概念和常用术语

模式(pattern):广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式。

特征(feature):描述事物某些物理、结构等方面信息的度量、属性。例如长度、重量、均值、方差等。

样本(sample):即一个事物在某些特征上的取值的“组合”,有时也被称为模式(paJern)、例子(example)

      在科学研究或工程实践中,往往可以把模式识别系统的输入整合为一个nxd维的矩阵,其中n为样本数,d为特征数;

特征矢量:在当前的主流模式识别文献中,样本往往被表示为一个矢量,每一维对应一个特征,这个矢量就叫特征
矢量(为便于记忆,可粗略认为特征矢量=样本)。

特征空间:一个由d个特征表示的样本可视为在一个d维欧式空间中的一个点,这个空间的每一维都对应了一个特征,
因此也叫特征空间。

假设空间(hypothesis space) :一个模式识别系统h(x)描述了其输入和输出之间的关系,这种关系称为假设(hypothesis)。所谓空间,从数学意义上讲就是一个集合。因此,一个模式识别问题的假设空间,就是指所有可能的假设的集合。

分类(classifica-on) :把某一事物判定为已被预先定义好的一个类别的过程。

聚类(clustering) :将事物的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇(cluster)是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。

分类与聚类的本质差别在于“类别”是否已经预先定义好。

训练(training):根据一组训练样本(trainingsamples),获取一个尽可能好的模式识别系统(尤其是分类器)的过程。从另一个角度来说,“训练”可视为在假设空间中寻找最佳假设h(x)的过程。

测试(testing):针对一组测试样本(testingsamples),评价/检验一个模式识别系统性能的过程。

有监督学习(supervised learning):利用一组已知类别的样本训练分类器,使其达到所要求性能的过程,也称为监督训练或有监督学习。

无监督学习(unsupervised learning):若训练样本不带有类别信息,就是无监督学习。

泛化能力(generalization ability):一个模式识别系统对新样本的适应能力。我们希望一个模式识别系统经过训练,能获得隐含在数据背后的规律,对具有同一规律的样本,即使以前从未见过,也能给出正确(或合适)的输出,该能力称为泛化能力。(形象地说,就是“举一反三”的能力)

       以分类问题为例,在设计一个模式识别系统的过程中:
• 我们首先需要有一组训练样本(模式),每一个样本由若干个特征描述,表示为一个特征矢量的形式,并可视为在特征中间中的一个点。

• 然后,我们需要利用有监督学习的方法训练一个模式识别系统。这个过程可视为在假设空间中寻找一个最符合我们要求的假设。
• 最后,我们需要针对一组测试样本,检验训练好的模式识别系统的泛化能力


这篇关于The Definition of Pattern Recognition的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/970033

相关文章

设计模式 -- 职责链模式(Chain of Responsibility Pattern)

1 问题引出 1.1 学校 OA 系统的采购审批项目 如果金额 小于等于 5000, 由教学主任审批 (0<=x<=5000)如果金额 小于等于 10000, 由院长审批 (5000<x<=10000)如果金额 小于等于 30000, 由副校长审批 (10000<x<=30000)如果金额 超过 30000 以上,有校长审批 ( 30000<x) 1.2 传统方式 传统方式是

人脸识别开源项目之-face_recognition

特性 从图片里找到人脸 定位图片中的所有人脸: import face_recognitionimage = face_recognition.load_image_file("your_file.jpg")face_locations = face_recognition.face_locations(image) 识别人脸关键点 识别人脸关键点,包括眼睛、鼻子、嘴和下巴。

Attribute Recognition简记1-Video-Based Pedestrian Attribute Recognition

创新点 1.行人属性库 2.行人属性识别的RNN框架及其池化策略 总结 先看看行人属性识别RNN结构: backbone是ResNet50,输出是每一帧的空间特征。这组特征被送到两个分支,分别是空间池化和时间建模。最后两种特征拼接。然后分类(FC)。 LSTM关注帧间变化。受cvpr《Recurrent Convolutional Network for Video-Based Person

Face Recognition简记1-A Performance Comparison of Loss Functions for Deep Face Recognition

创新点 1.各种loss的比较 总结 很久没见到这么专业的比较了,好高兴。 好像印证了一句话,没有免费的午餐。。。。 ArcFace 和 Angular Margin Softmax是性能比较突出的

配置aop报错: Pointcut is not well-formed: expecting 'name pattern' at character position

切入点表达式的使用规则: execution(modifiers-pattern? ret-type-pattern declaring-type-pattern? name-pattern(param-pattern) throws-pattern?) 有“?”号的部分表示可省略的,modifers-pattern表示修饰符如public、protected等,ret-type-patter

奇异递归模板模式(Curiously Recurring Template Pattern)

奇异递归模板模式(Curiously Recurring Template Pattern) - 知乎 (zhihu.com) 本文来自上面的文章!!!本菜鸡学习和记录一下。 CRTP是C++模板编程时的一种惯用法:把派生类作为基类的模板参数。 1.静态多态 #include <iostream>using namespace std;template <typename Child>

CMakeCXXCompilerId.cpp:514: multiple definition of `main';

cmake的时候报的这个错误,反复检查了 代码 只有一个main() 方法,后来查看了CMakeCXXCompilerId.cpp: 这个文件,发现在最后cmake 产生了一个main 和我的main 函数冲突;解决办法 手动删掉CMakeCXXCompilerId.cpp 中的main方法,保存后 make就能编译过了。没有找到原因为啥 会这样,我反复试过 重新cmake ,每次都会产生,且别人

pandas errors Pattern matched multiple keys

Set some Pandas options as you like old version #pd.set_option(‘max_columns’, 40) #pd.set_option(‘max_rows’, 30) new version pd.options.display.max_rows=30 pd.options.display.max_columns=40

【读点论文】Scene Text Detection and Recognition: The Deep Learning Era

Scene Text Detection and Recognition: The Deep Learning Era Abstract 随着深度学习的兴起和发展,计算机视觉发生了巨大的变革和重塑。场景文本检测与识别作为计算机视觉领域的一个重要研究领域,不可避免地受到了这波革命的影响,从而进入了深度学习时代。近年来,该社区在思维方式、方法论和性能方面取得了长足的进步。本综述旨在总结和分析深度学

设计模式 -- 组合模式(Composite Pattern)

1 问题引出         编写程序展示一个学校院系结构:需求是这样,要在一个页面中展示出学校的院系组成,一个学校有多个学院, 一个学院有多个系。如图: 2 基本介绍 组合模式(Composite Pattern),又叫部分整体模式,它创建了对象组的树形结构,将对象组合成树状结构以表示“整体-部分”的层次关系。 组合模式依据树形结构来组合对象,用来表示部分以及整体层次。