“模式识别”的概念、定义、翻译、参考文献-科学参考

单词

模式识别

释义

【模式识别】

拼译：patlern recognition

是利用计算机对某一种研究对象，根据其某些特征进行识别与分类，使其识别的结果尽量与客观事物相符。这里所指的“模式”有着广泛的含义，是图形、波形、不同的疾病、植物的类别、不同成份的矿石，总之，包括自然界中各种各样需要识别的对象。

20世纪70年代以来，模式识别在理论研究和工作实践中都有迅速的发展，已形成一个独立的科学分支，应用范围涉及文识别、目标检测、医学诊断、生物医学信号提取、图象分析、遥感、人脸及指纹识别、考古学、语言识别、机器零件识别等，几乎遍及所有自然科学，社会科学及技术部门。

国际上图像识别这一课题已受到极大的重视，1973年IEEE在华盛顿发起并召开了以模式识别为专题的第1次国际学术会议，1976年的第2次国际模式识别会议上，成立了国际模式识别协会(IAPR)，几乎每年都有学术活动，除会议报告集或专著外，目前在世界上有几十种杂志都刊登模式识别及有关领域的论文。在《Computer Graphies and Image Processing杂志上，每年都载有模式识别及有关全年文章之总清单。在句法模式识别方面，美国普渡大学美籍华人傅京孙(1930～1985)作出了杰出贡献，他于1974年在自己工作的基础上，总结概括了以往的研究结果，发表了第1本句法方面的专著《K．S．Fu Syntaatic Methods in Pattern Recognition，Academic Press》奠定了这一模式识别分支的基础。在此基础上经过不断的努力，已形成分析与表达模式结构的方法，1980年初，傅京孙著的《模式识别与应用》一书，论述了句法模式识别的理论、方法及应用，以及当时的成果。

在模式识别中，为了分析和描述这些模式，首先要进行某些预处理，以去除测量中的噪声和冗余度，从而保证有效的模式描述。其次，取一个特征量集合，由这些特征量之间相互关系以表示模式。在这些表示的基础上然后分类和描述。

为了易于模式识别，需要一个好的特征集合，以及它们的相关关系。为此，需要知道模式的统计的和结构的特征，并应当充分利用它们。从这一观类出发，所谓模式识别包含了模式特征分析与识别系统设计。在模式识别中，已提出许多数学方法，归纳起来无非是判决理论(统计的)和句法(结构)方法。一个模式有N个特征或用N维特征关量表示。而判决则建立有相似度上，因此用距离、似然函数或鉴别用函数表示。在句法方法中，是将一个模式用模式基元和它们的关系的数据库的数或图形表示。这种方法把模式结构与语言法相比拟，于是判决可以当成一种语言程序。还有一种比较直观的模板匹配法，其判决只是把未知的输入与对应的模板匹配，匹配准则是描述这两者的相似程度。

在判决理论方法中，要经过特征提取与选择及分类与学习等步骤。一般特征提取与选择分成以下两个主要方面。(1)特征空间变换：其目的是将原始的特征空间变换成低维数的特征空间，以便于模式的表示和分类。为了区分类别，通常建议采用类间距离最大化，或类间距离最小化，或这两者的组合作为一种优化准则。特征空间变换可采用线性或非线性变换，一般说非线性变换比线性变换好，但非线性变换需要复杂的计算。实现非线性变换，常常采用迭代算法和交互程序。作为特征空间变换的最佳标准，应反映识别系统识别结果的真实性。(2)信息和距离的量度；选择特征的主要目的是在不明显降低识别性能的条件下，在给定的N个特征中选出l个特征(l＜N)。为了指导特征的选择，常常定义－距离量度，它与误识概率上界下界有关，也就是对被选用的特征子集应使预先指定的距离度量为最大。获得最佳的特征选择是困难的，因此人们在研究特征选择的有效搜索算法。

在分类与学习方面，分类可解释成把特征空间分割成互不相关的区域，而每一个区域只居于一个类别，不同类别之间的界面在数字上用到别函数表示。对于监督分类，要依靠已知所属类别的训练样本集，按它们特征向量的分布来确定到全函数，只有在判别函数确定之后才能用它来对未知模式进行分类判别，这就要求我们对于要分类的图像有足够的先验知识。而要做到这一点，往往要付出相当大的代价。在没有先验知识的情况下，可用非监督分类，通常采用聚类分析方法。它是基于“物以类聚”的观点，用数学方法分析各特征向量之间的距离及分散情况，根据这些参数自动进行聚类，统计识别中的参数和非参数方法；统计模式识别是以模式集在特征空间中分布来近似密度分布的类概率密度函数为基础。当模式样本的类概率密度函数的形式是已知的，或者从提供的作为设计分类器用的训练样本能估出类概率密度函数的近似式，则在具体计算中，密度函数的未知参数就可用合适估计量来取代。例如在多数场合常用多维正态分布，这不仅符合自然界多数分布，也可简化分析计算。因正态分布用均值向量和协方差矩阵就可完全代表，计算判别函数只需用估计参数来运算。参数估计最常用的有最大贝叶斯估计和最大似然估计。假如类概率密度函数不知，或者所提供的训练样本数目不足以估计概率密度函数，则只能借助于非参数方法。非参数方法有多种形式，且各不相关。常用的有k一最近邻判决规则，它直接按k个最近邻样本的不同类别分布，将未知类别的特征向量分类。也可以采用直接确定判别函数的形式，例如确定判别函数是线性方程或二次多项式等，再利用训练样本的特征向量值直接计算判别函数的系数。用参数或非参数方法来确定判别函数，都可以采用估计的方式进行。

待识别的景物，如果用已知结构信息的图象作为训练样本，先识别出基元和它们的连接关系，并用字母符号代表，然后用构造句子的文法来描述生成这幅场景的过程，由此推断出生成该场景的一种文法规则，这就是训练过程。在识别过程中，同样要对未知结构信息的图象进行基元识别及其相互结构关系的分析，然后用训练过程获得文法作句法分析，如果它能被已知结构信息的文法分析出来，则该幅未知图象具有相同的图形结构，否则就不是这种结构，这就是模式识别的句法／结构方法。在句法方法中－模式是由一种以某语法规则的语言中的一个子句表示的，这种描述结构的语言通常叫做模式描述语言。这种语法(将基元组成模式的规则)被称为模式语法。最近的研究表明，模式可有效地用语义信息和结构信息的组合表示。关于基元的提取，还没有一套完整的一般的解决方法。对于线性模式或由边界与骨架描述的模式，常常建议采用直线段做为基元。直线段可由长度和斜率表示。同样，曲线段可用其长度和曲率描述，利用区域的模式描述建议采用平面作为基元，目前提出一种通用的形状描述方法，它是由两种基元来描述区域边界即曲线基元和角度基元。模式描述的具体语法的选择与基元的选择、语法描述能力、语法分析效率有关。上下文无关的程序算法已被建议用于模式描述，包括保持了上下文无关文法的简单性，又能产生上下文敏感的语言。

目前已有许多专门的语法，诸如英文、中文汉字、染色体、化学结构、颈动脉冲波、二维飞机形状、指纹模式等。为了有效地描述高维模式，在句法识别已采用web语法、图表语法、树状语法和形状语法。

客观世界中很多概念没有明确的外延，对于这些概念的集合、类别的划分是模糊的。近10多年来，模糊识别有很大的发展。鉴于人工神经网络具有大规模并行处理、分布存储、自适应(学习)过程。其成果被应用于模式识别中。

【参考文献】：

1 Fu K S．Syntactic Pattern Recognition．1982

2 Tou J T T，Gonzalez R G．Pattern Recognition．1974

3 Edzard S．Gelsema，Laveen N，Kannal，Pattern Recognition in Practice．1980

4 冈蔡雷斯R C，汤姆逊M G．句法模式识别类，濮群，等译．北京：清华大学出版社，1984

5 毕厚杰．模式识别的进展．第五届全国模式识别及机器智能学术议论文集．1986

6 戴汝为．句法模式识别的进展．第五届全国模式识别及机器智能学术会议论文集．1986

7 李介谷，蔡国廉，等．计算机模式识别技术．上海：上海交大出版社，1986

8 蔡元它．模式识别．西安：西安电子科大出版社，1990

(合肥工业大学钱源诚教授撰)

随便看

科学参考收录了7804条科技类词条，基本涵盖了常见科技类参考文献及英语词汇的翻译，是科学学习和研究的有利工具。