强分类器与弱分类器(ZZ)

现在的位置: 首页 > 综合 > 正文

强分类器与弱分类器(ZZ)

2014年01月10日 ⁄ 综合 ⁄ 共 2382字 ⁄ 字号小中大 ⁄ 评论关闭

动物，包括人类在内，通常是通过判断周边的情况后做出行动，这种反应速度的迅速性和灵活性令人吃惊。大多数生物如一次判断失误，下次便会纠正失误的判断基准。信息识别技术通过借鉴生物的这种灵活的信息处理特征，在信息技术处理方面获得了巨大进步。人类通常以来采取的方法是对需识别的对象做尽可能详细的调查，然后把调查得来的数据与预先获得的数据进行统计、分析，然后得出结论。另外，人们也可以根据持有的经验获得有效的判断效果。例如，对于路面上的一只动物，首先我们根据它的轮廓判断其大小，根据大小判断它可能是一只狗或猫；然后我们接近它，仔细观察它的形状和颜色，发现它既非狗也非猫，而是一只狐狸。这时，我们的经验库里就会增加同样大小的动物也包括狐狸的可能性。各种生物就是通过不断重复这种有机有序的判别方法，做出快速，准确，灵活的反应。

举一个简单的例子来说明图像识别。如图1所示平面上的一个圆形，传统的方法是尽量采用强分类器来加以识别。假设对象物圆点为(I,J)，半径为5，针对标本点(x,y)，我们来判断以下公式(1)能否成立。

(x-I)²+(y-J)²=5(1)

图 1

以坐标点(I,J)为圆心，半径为5的圆形（着色部分图像）

从图 1可以看出，图中着色标本点不能完全满足公式(1).例如，尽管点(5,0)完全满足公式1，但是点(4,2)存在误差－离散空间下误差在所难免。但是，就整体来看，尽管存在误差点，仍可把这个图形识别为一个“大致”圆形。那么，如果把图1进一步变形为图2会产生怎样的效果呢？由公式(1)的评价结果来看，仅5个像素的偏移就增大了误差，但从外观上仍可将其识别为圆形。因此，我们仍将图2中的图形视为圆形，借用公式（1）来加以分析就很容易得出答案。总之，能否将其识别为圆形，我们需要提出判定基准，根据实际状况灵活地做出判断。

图 2

由图1中圆形稍微变形后形成的图形

针对上述单个分类器的性能不高的情况，我们可以考虑重复单纯的是或否判定来获得高精度的识别方法。如图3所示，把作为探索针的任意三条直线:γ₁,γ₂,γ₃, 与上述圆形相交后形成相交区域。如果直线数量少的话，就很难形成圆形。如果有成百上千条直线，就很容易构成圆弧范围。图中用绿色线表示识别边界。

图 3

任意直线γ₁,γ₂,γ₃与图1中圆形相交情况。绿色线部分表示相交区域范围。直线γ₃与圆形部分区域重叠。

把图2中变形后的圆形与这些直线重叠后形成图4所示情况。变形部分是直线γ₂ 横切图形点A处。由于未改变图形其它部分，对图形的局部条件改变不影响对图4中变形圆形的识别。由此看来，即便是复杂的图形，如具备较多数量的直线，通过重复简单特征识别(有时被称为弱分类器)仍可以达到高度识别的目的。这种识别方法被称作支持向量机算法(Support Vector Machine)或Booting算法。

图 4

图形变形及伴随变形的交叉位置移动情况

让我们来试用新近流行的识别方法，即利用数个弱分类器来进行人脸识别。用于人脸识别的有效而“简单的分类器”究竟是什么样的？人们还是期待使用简便，判定结果纯粹的分类器。让我们参考以下文献来作进一步探讨。

(P. Viola and M. Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features,” in Conf. On Computer Vision and Pattern Recognition, Hwaii, 2001; http://research.microsoft.com/~viola/Pubs/Detect/violaJones_CVPR2001.pdf(PDF: 194KB))。

参考文献中建议将哈尔变换(Haar transform)作为核心参数. 哈尔变换用一个包含(1, -1)行列的矩阵表达，如图5所示 (1)，(2), 用一组白色和黑色的筛选器表示。例如，把图5-(1)的筛选器放到脸部的眼睛和额头位置，由于额头位置的亮度较眼睛位置的亮度高，符合(1)的浓淡模式。如果额头被头发盖住，那么就不符合(1)的浓淡模式可能性。同样，把同一筛选器放在嘴部和嘴部上方区域，也会产生同样效果。尽管这种判定结果比较单纯，如果准备数千个考虑尺寸和位置的识别特征，然后把每次的识别结果加以组合，是可以得出非常精确的识别结果的。

图 5

简单识别特征与可适用的脸部位置。
筛选器(1)适用于2处不同位置。

高速识别测试

但是，以上的测试流程多数是以弱分类器为测试前提，测试流程难免烦琐。换言之，分类器的数量越多，所需识别时间越长。因此人们总是配置部分强分类器。如进行人脸识别时可抽取出共通特征，如不具备共同特征则可将其忽略不计。在图6中展示了用于图5中两种弱分类器组合后形成强分类器的功能。个体功能较弱的分类器通过三处测试结果的组合，可以识别出人类脸部的特征。只有三个浓淡模式同时成立时，可以判定其为人脸特征。换言之，如无此图像则无法做出评价。这种人脸判定流程如图7所示。

如流程图所示，最初判定时采用强分类器。但是把若干弱分类器组合后就形成功能较强的分类器，并具备相当高的威力。如分类器功能过于强大则使得识别结果时间延长而变得没有意义。较强分类器在于它可以迅速将不具备人脸特征的图像排除。在弱识别特征很多时，通过配置数个简单而强大的分类器，可以迅速提高识别速度。

图 6