- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8月13号人脸识别
1、AdaBoost 的人脸检测
人脸检测是指对于任意一幅给定的图像,采用一定的策略对其进行搜索以确定其中是否含有人脸,如果是则返回一脸的位置、大小和姿态。
1.1矩形特征
在给定有限的数据情况下,基于特征的检测能够编码特定区域的状态,而且基于特征的系统比基于象素的系统要快得多。矩形特征对一些简单的图形结构,比如边缘、线段,比较敏感,但是其只能描述特定走向(水平、垂直、对角)的结构,因此比较粗略。如下图,脸部一些特征能够由矩形特征简单地描绘,例如,通常,眼睛要比脸颊颜色更深;鼻梁两侧要比鼻梁颜色要深;嘴巴要比周围颜色更深。
我们将使用简单矩形组合作为我们的特征模板。这类特征模板都是由两个或多个全等的矩形相邻组合而成,特征模板内有白色和黑色两种矩形(定义左上角的为白色,然后依次交错),并将此特征模版的特征值定义为白色矩形像素和减去黑色矩形像素和。
最简单的5个特征模板:
特征模板可以在子窗口内以“任意”尺寸“任意”放置,每一种形态称为一个特征。找出子窗口所有特征,是进行弱分类训练的基础。。假设一个矩形区域大小为24*24,那么,如果穷举区域内所有可能的矩形个数,总数将有45396个。显然这比这个区域内所有的像素个数(576个象素)要多得多。我们不可能把所有的这些特征都用于检测,否则我们的计算消耗将是不可估计的大了。我们的目的即是尽可能少的选取最能区分人脸和非人脸的图像的那些特征,从而大大降低计算开销。具体的选择方法即为基于AdaBoost的学习算法,具体的将在后续的章节中介绍。
现在已经有了简单的特征,我们还需要一些简单的分类器。为了能使得这些分类器足够的简单,我们就把分类器和这些矩形特征做个一一对应。亦即每个分类器就由一个特征的值来决定。于是我们得到如下的简单分类器原型:
其中就是基于简单特征的分类器,就是待检测子窗口,就是对于子窗口的矩形特征值计算函数,就是一个符号因子(对于不同的特征,计算得到的特征值中有可能负例的值小于正例,也有可能负例的值大于正例,因此正例不都是小于区分正负例的阈值的,也有可能大于,所以引入一个符号因子来确定不等式方向),就是对应分类器的阈值。
1.2积分图(Integral Image)
针对已经引入的矩形特征,为了进一步降低所需要的计算成本我们引入了积分图的概念。这是一种对原图像的中间表达方式,这种表达方式可以使得矩形特征的值能非常快地得到计算。
所谓的积分图像其实就是对原图的一次双重积分(先是按行积分,然后是按列积分)。那么它的积分表示即为:
其中,是原图像,是积分图像。
又因为我们计算的是原图中某一点左上方所有象素值的和,可见是一个离散的加和,因此在点x,y的积分图像的计算方法就如下所示:
其中是计算后的积分图像,是原图像,如下图所示。
图8 在(x,y)点的积分图像的值是所有在这个点的左上方的点的和
图9
如上图所示,在矩形D中的像素和可以通过四点计算得到。在点1的积分图像的和可以通过矩形A内的点的和得到。在点2的值就是A+B,在点3的值就是A+C,在点4的值就是A+B+C+D。在D内的点的和可如下计算得到:4+1-(2+3)。如果使用以下函数:
其中是每列的和,,,积分图像可以在对原图的一次遍历后计算得到。
如果使用积分图像,那么任何矩形中的象素和都能通过四个顶点的??计算出来。显然,双矩形特征的值可以通过八个顶点计算得到。然而,双矩形特征包括了两个相邻的矩形和,因此它们可以用六个顶点的值计算得到。如果是三矩形就是八个点,四矩形就是九个点,如下图所示。
图10 四种不同矩形特征计算示所需要的顶点的值
特征A的值为: (6-5-3+2)-(5-2-4+1);特征B的值为:(4-3-2+1)-(6-4-5+3); 特征C的值为:(7-6-3+2)-(6-5-2+1)-(8-7-4+3);特征D的值为: (6-5-3+2)+(8-7-5+4)-(5-4-2+1)-(9-8-6+5)
1.3 AdaBoost 的基本原理
给定一个特征集合和一个包含正样本和负样本图像的训练集,任何机器学习的方法都可以用于通过学习来训练分类函数。我们回想一下,每个图像的子窗口有45,396个矩形特征,这个数字远远超过了像素的个数。即使每个特征能够很快的计算出来,计算这么多的矩形特征也是不可能的。实验已经证实了我们假设,也就是很小一部分的这种特征可以结合起来组成一个有效的分类器。主要的问题就是如何找出这些特征。
采用AdaBoost方法,用于选择特征和训练分类器。AdaBoost学习方法是用来达到简单学习算法的分类效果的。它通过结合一组弱分类函数来组成一个强大的分类器。这种简单学习算法被称为弱学习机。我们称其为学习机是因为,这个分类器的学习算法会对一个分类器集做一个
文档评论(0)