现在的位置: 首页 > 综合 > 正文

模式识别–图像识别技术的核心

2013年02月23日 ⁄ 综合 ⁄ 共 2727字 ⁄ 字号 评论关闭
  图像识别即对一幅图像进行适当的处理后将其中的目标对象识别出来。该项技术主要涉及数字信号处理和模式识别两个方面的,数字信号处理是模式识别的前提和铺垫,模式识别是图像识别的实质性阶段。

 

  广义地说,存在于时间和空间中可观察的事物,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式识别就是根据观察到的事物的模式对事物进行分类的过程。在图像识别技术中,模式识别占有核心的地位。所有的图像处理技术都是为了更好地进行模式识别做准备。模式识别是图像识别的实质性阶段。

 

  有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法,与此相应的模式识别系统都由两个过程所组成,即设计和实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器的设计。实现是指用所设计的分类器对待识别的样本进行分类决策。

 

 

模式识别系统的基本构成

 

 

  模式识别系统(如图6-2)中,信息获取和预处理部分大致可以与图像的获取与处理对应一般情况下,模式识别技术主要包含"特征提取和选择""分类器的设计"

 

 

  近几十年来,模式识别技术发展很快。然而,发展较成熟、应用较广泛的主要是统计模式识别技术。

 

 

  统计模式识别

 

 

  从一个广义的角度看,模式识别可以看成是一种机器学习的过程。按照机器学习过程的性质,可以将模式识别方法分成有监督的模式识别方法和非监督的模式识别方法,后者又称为聚类分析方法。这两种方法在图像识别中都有广泛的应用。

 

 

  (1)有监督的模式识别方法

 

 

  从识别技术的基本思路和方法看,有监督的模式识别可以分成两类:基于模型的方法和直接分类的方法。

 

 

  基于模型的方法的基础是贝叶斯(Bayes)决策理论方法,它对模式分析和分类器的设计有着实际的指导意义,是统计模式识别中的一个基本方法,用这个方法进行分类时要求:

 

 

  ①各类别总体的概率分布(即所谓的先验概率和类条件概率)是已知的;

 

 

  ②要决策分类的类别数是一定的。

 

 

  (2)非监督的模式识别方法

 

 

  在很多实际应用中由于缺少形成模式类过程的知识.或者由于实际工作中的困难(例如卫星遥感照片上各像元的分类问题),我们往往只能用没有类别卷标的样本集进行工作。这就是通常所说的非监督学习方法。一般来说非监督学习方法可以分成两大类,即基于概率密度函数估计的直接方法和基于样本间相似性度量的间接聚类方法。不论是哪一种方法,在把样本集划分为若干个子集(类别)后,我们或者直接用它解决分类问题.或者把它作为训练样本集进行分类器设计。

 

 

  结构模式识别

 

 

  在一些图像识别的问题中,往往需要了解图像的结构信息。识别的目的不仅要能够把图像指定到一个特定类别(把它分类),而且还要描述图像的形态。这时用语言结构法来识别图像就很有吸引力。句法方法使我们能够用一小组简单的模式基元和文法规则来描述一大组复杂的图像模式。

 

 

  模糊模式识别方法

 

 

  1965年,Zadeh提出了他著名的模糊集理论,从此创建了一个新的学科--模糊数学。模糊集理论是对传统集合理论的一种推广,在传统集合理论中,一个元素或者属于一个集合,或者不属于一个集合;而对于模糊集来说,每一个元素都是以一定的程度属于某个集合,也可以同时以不同的程度属于几个集合。对人们现实生活中大量使用的一些含义确定,但又不准确的语言表述。比如"今天天气很热""车速过高,需要适当踩刹车"等,模糊数学能够较好地表达。因此,模糊数学被很多人认为是解决很多人工智能问题,尤其是常识性问题的最合适的数学工具。

 

 

 

  将模糊技术应用于各个不同的领域,就产生了一些新的学科分支,比如和人工神经网络相结合,就产生了所谓模糊神经网络;应用到自动控制中,就产生了模糊控制技术和系统;应用到模式识别领域来,自然就是模糊模式识别。

 

 

  模式识别从一开始就是模糊技术应用研究的一个活跃领域。一方面,人们针对一些模糊式识别问题设计了相应的模糊模式识别系统;另一方面,对传统模式识别中的一些方法,人们用模糊数学对它们进行了很多改进。这些研究逐渐形成了模糊模式识别这一新的学科分支。

 

 

  神经网络识别方法

 

 

  从深层意义上看,模式识别与人工智能所研究的是如何用计算机实现人脑的一些功能。一方面,从要实现的功能出发,我们可以将功能分解成子功能,直至设计出算法来实现这些子功能。这是自顶向下的分析方法。另一方面,人脑无论多么复杂。都可以看作是由大量神经元组成的巨大的神经网络。从神经元的基本功能出发,逐步从简单到复杂组成各种神经网络,研究它所能实现的功能,是自底向上的综合方法。两种方法各有优缺点,适用于不同的问题。

 

 

  应当指出的是,人工神经网络并不是一个十分严格的概念,而且,当感知器等基本模型最早提出时也并没有被冠以人工神经网络的名字。现在,人们倾向于把那些具有大量(或多个)简单计算单元、单元之间具有广泛的连接、且连接的强度(有时还包括单元的计算特性)可根据输入输出数据调节的算法或结构模型称为一种人工神经网络。不同的单元计算特性(神经元类型)、单元间的连接方式(网络结构)和连接强度调节的规律(学习算法)形成了不同的人工神经网络模型。

 

 

  产生于不同起源和针对不同目的的神经网络模型有很多种,多层感知器、自组织映像和Hopfield网络都是其中具有代表性的模型之一。前两者也是在模式识别应用中最典型的两种模型,后者更多地用于优化组合问题,比如模式识别中的特征选择问题。

 

 

  神经网络模式识别方法的一个重要特点就是它能够较有效地解决很多非线性问题,而且在很多工程应用中取得了成功。但另一方面,神经网络中有很多重要的问题尚没有从理论上得到解决,因此实际应用中仍有许多因素需要凭经验确定,比如如何选择网络节点数、初始权值和学习步长等;局部极小点问题、过学习与欠学习问题等也是在很多神经网络方法中普遍存在的问题。有时会出现这样的情况,即同样一种神经网络方法,在一些应用中可能取得很好的结果,而在另外一些相似的应用中却可能完全失败。还有研究表明,虽然多层感知器网络理论上具有实现任意复杂的分类的能力,但是对于一些识别中需要有可靠的拒绝的情况(比如身份确认),多层感知器似乎无法胜任。这些问题的存在,已经在很大程度上制约了人工神经网络理论和应用的发展。值得高兴的是,现在人们已经充分认识到这些问题,并开始进行更深入的研究,比如统计学习理论就已经在提供研究模式识别和神经网络问题的一个更完善的理论框架上取得了长足的进展。
from

抱歉!评论已关闭.