现在的位置: 首页 > 综合 > 正文

强分类器与弱分类器(ZZ)

2014年01月10日 ⁄ 综合 ⁄ 共 2382字 ⁄ 字号 评论关闭
 

动物,包括人类在内,通常是通过判断周边的情况后做出行动,这种反应速度的迅速性和灵活性令人吃惊。大多数生物如一次判断失误,下次便会纠正失误的判断基准。信息识别技术通过借鉴生物的这种灵活的信息处理特征,在信息技术处理方面获得了巨大进步。人类通常以来采取的方法是对需识别的对象做尽可能详细的调查,然后把调查得来的数据与预先获得的数据进行统计、分析,然后得出结论。另外,人们也可以根据持有的经验获得有效的判断效果。例如,对于路面上的一只动物,首先我们根据它的轮廓判断其大小,根据大小判断它可能是一只狗或猫;然后我们接近它,仔细观察它的形状和颜色,发现它既非狗也非猫,而是一只狐狸。这时,我们的经验库里就会增加同样大小的动物也包括狐狸的可能性。各种生物就是通过不断重复这种有机有序的判别方法,做出快速,准确,灵活的反应。

举一个简单的例子来说明图像识别。如图1所示平面上的一个圆形,传统的方法是尽量采用强分类器来加以识别。假设对象物圆点为(I,J),半径为5,针对标本点(x,y),我们来判断以下公式(1)能否成立。

(x-I)2+(y-J)2=5(1)

图 1

图 1

以坐标点(I,J)为圆心,半径为5的圆形(着色部分图像)

从图 1可以看出,图中着色标本点不能完全满足公式(1).例如,尽管点(5,0)完全满足公式1,但是点(4,2)存在误差-离散空间下误差在所难免。但是,就整体来看,尽管存在误差点,仍可把这个图形识别为一个“大致”圆形。那么,如果把图1进一步变形为图2会产生怎样的效果呢?由公式(1)的评价结果来看,仅5个像素的偏移就增大了误差,但从外观上仍可将其识别为圆形。因此,我们仍将图2中的图形视为圆形,借用公式(1)来加以分析就很容易得出答案。总之,能否将其识别为圆形,我们需要提出判定基准,根据实际状况灵活地做出判断。

图 2

图 2

由图1中圆形稍微变形后形成的图形

针对上述单个分类器的性能不高的情况,我们可以考虑重复单纯的是或否判定来获得高精度的识别方法。如图3所示,把作为探索针的任意三条直线:γ1,γ2,γ3, 与上述圆形相交后形成相交区域。如果直线数量少的话,就很难形成圆形。如果有成百上千条直线,就很容易构成圆弧范围。图中用绿色线表示识别边界。

图 3

图 3

任意直线γ123与图1中圆形相交情况。绿色线部分表示相交区域范围。直线γ3与圆形部分区域重叠。

把图2中变形后的圆形与这些直线重叠后形成图4所示情况。变形部分是直线γ2 横切图形点A处。由于未改变图形其它部分,对图形的局部条件改变不影响对图4中变形圆形的识别。由此看来,即便是复杂的图形,如具备较多数量的直线,通过重复简单特征识别(有时被称为弱分类器)仍可以达到高度识别的目的。这种识别方法被称作支持向量机算法(Support Vector Machine)或Booting算法。

图 4

图 4

图形变形及伴随变形的交叉位置移动情况

让我们来试用新近流行的识别方法,即利用数个弱分类器来进行人脸识别。用于人脸识别的有效而“简单的分类器”究竟是什么样的?人们还是期待使用简便,判定结果纯粹的分类器。让我们参考以下文献来作进一步探讨。

(P. Viola and M. Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features,” in Conf. On Computer Vision and Pattern Recognition, Hwaii, 2001; http://research.microsoft.com/~viola/Pubs/Detect/violaJones_CVPR2001.pdf(PDF: 194KB))。

参考文献中建议将哈尔变换(Haar transform)作为核心参数. 哈尔变换用一个包含(1, -1)行列的矩阵表达,如图5所示 (1),(2), 用一组白色和黑色的筛选器表示。例如,把图5-(1)的筛选器放到脸部的眼睛和额头位置,由于额头位置的亮度较眼睛位置的亮度高,符合(1)的浓淡模式。如果额头被头发盖住,那么就不符合(1)的浓淡模式可能性。同样,把同一筛选器放在嘴部和嘴部上方区域,也会产生同样效果。尽管这种判定结果比较单纯,如果准备数千个考虑尺寸和位置的识别特征,然后把每次的识别结果加以组合,是可以得出非常精确的识别结果的。

图 5

图 5

简单识别特征与可适用的脸部位置。
筛选器(1)适用于2处不同位置。

高速识别测试

但是,以上的测试流程多数是以弱分类器为测试前提,测试流程难免烦琐。换言之,分类器的数量越多,所需识别时间越长。因此人们总是配置部分强分类器。如进行人脸识别时可抽取出共通特征,如不具备共同特征则可将其忽略不计。在图6中展示了用于图5中两种弱分类器组合后形成强分类器的功能。个体功能较弱的分类器通过三处测试结果的组合,可以识别出人类脸部的特征。只有三个浓淡模式同时成立时,可以判定其为人脸特征。换言之,如无此图像则无法做出评价。这种人脸判定流程如图7所示。

如流程图所示,最初判定时采用强分类器。但是把若干弱分类器组合后就形成功能较强的分类器,并具备相当高的威力。如分类器功能过于强大则使得识别结果时间延长而变得没有意义。较强分类器在于它可以迅速将不具备人脸特征的图像排除。在弱识别特征很多时,通过配置数个简单而强大的分类器,可以迅速提高识别速度。

图 6

图 6

特征组合增强脸部识别

图 7

图 7

根据识别器多段处理进行的人脸识别流程图。识别成功后移动到下一图像。

照片 1

照片 1

被识别的“人脸”,比识别现代人脸要多出20倍时间。

对照片-1中的人脸识别要比现代人脸识别时间多出20倍。这是因为记忆了现代人特征的弱分类器对照片中的若干不同特征的识别分值不够大,还需要增加超过阈值的弱识别特征。

我们在很多情况下需要根据弱特征做出识别,判断。本次介绍的利用弱分类器进行识别的方法,非常适合模糊判定条件下的应用。

抱歉!评论已关闭.