Paul Viola经典人脸检测算法论.docVIP

下载本文档

16
0
约1.11万字
约 13页
2017-05-07 发布于湖北
举报
版权申诉

Paul Viola经典人脸检测算法论.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Paul Viola经典人脸检测算法论

简单特征的优化级联在快速目标检测中的应用 Paul Viola viola@ 三菱电气实验室mjones@ 康柏剑桥研究所剑桥中心剑桥，MA02142 摘要本文描述了一个视觉目标检测的机器学习法，它能够非常快速地处理图像而且能实现高检测速率。这项工作可分为三个创新性研究成果。第一个是一种新的图像表征说明，称为“积分图像”，它允许我们的检测的特征得以很快地计算出来。第二个是一个学习算法，基于Adaboost自适应增强法，可以从一些更大的设置和产量极为有效的分类器中选择出几个关键的视觉特征。第三个成果是一个方法：用一个“级联”的形式不断合并分类器，这样便允许图像的背景区域被很快丢弃,从而将更多的计算放在可能是目标的区域上。这个级联可以视作一个目标特定的注意力集中机制，它不像以前的途径提供统计保障，保证舍掉的地区不太可能包含感兴趣的对象。在人脸检测系统的检测率的最佳。应用，探测器每秒15帧运行检测。本文的第一个是一个新的称为图像，。我们的检测系统不能强度[10]。这些一样，我们使用基函数：（尽管我们也使用一些更复杂的）。为了多尺度这些特性，我们引进了。图像每个像素使用一些操作。任何一个可以任何规模或位置。本文的第二个是使用AdaBoos算法选择构建[6]。在任何图像子窗口非常大，远远超过了像素数。为了确保快速分类，在学习过程中必须除的大部分可用的，一小部分关键。选拔工作是通过一个AdaBoost的简单修改：弱学习，使每一个弱分类器依赖1[2]。每个，选择一个新的弱分类器，可以作为一个选择过程 AdaBoost算法一个有效的学习算法和[13，9，10]。本文的主要是在一个集图像有希望的地区大大提高了探测器的速度。是它往往能够迅速确定在图像中的一个对象可能会出现[17，8，1]。更复杂的处理这些有希望的地区。这种做法是“负误视”（在模式识别中，将属于物体标注为不属于物体）的率。几乎所有的，对象实例是由注意力选择。在人脸检测，两个有可能达到1％不到40％该滤器的作用是超过一半的最终器必须进行评估。用户界面，图像数据库，及电话会议低功率的小型设备，包括手持设备和嵌入式处理器。200 MIPS的低功耗处理器我们的目标检测程序是基于简单的特征值来分类图像的。之所以选择使用特征而不是直接使用像素，主要是因为特征可以解决特定领域知识很难学会使用有限训练资料的问题。对于这些系统来说，选择使用特征还有另外一个重要原因：基于特征的系统的运行速度要远比基于像素的快。矩形特征可以反映检测窗口之间的联系。白色矩形框中的像素和减去灰色矩形框内的像素和得到特征值。(A)和(B)是矩形特征。(C)是三矩形特征。(D)是四矩形特征。图 1 上述简单特征是基于Haar基本函数设置的，Papageorgiou等人已使用过[10]。而我们则是更具体地选择了特定的三类特征。其中，双矩形特征的值定义为两个矩形区域里像素和的差。而区域则具有相同尺寸和大小，并且水平或垂直相邻（如图1）。而三矩形特征的值则是两个外侧矩形的像素和减去中间矩形的和所得的最终值。最后一个四矩形特征的值是计算两组对角线矩形的区别而得的。检测器的基本分辨率设定为24×24，既而得到数目巨大的矩形特征的完备集，超过了180000。需要注意的是，矩形特征的集合不像Haar基底，它是过完备1的。 2.1积分图像我们采用一个中间表示方法来计算图像的矩形特征，这里称为积分图像2。位置x,y上的积分图像包含点x,y上边和左边的像素和，包括：当是积分图像，是原始图像。可以使用下列一对循环：（1）（2）（这里是累积行和，，）积分图像可以通过已知原始图像而一步求得。使用积分图像可以把任意一个矩形用四个数组计算(见图2)。显然两个矩形和之差可以用八个数组。因为双矩形特征的定义是两个相邻矩形的和，所以仅用6个数组就可以计算出结果。同理三矩形特征用8个，四矩形特征用9个。矩形D内的像素和可以按四个数组计算。位置1的积分图像的值就是矩形A中的像素之和。位置2的值是A+B，位置3的值是A+C，而位置4的值是A+B+C+D。那么D中的像素和就是4+1-（2+3）。图 2 2.2特征讨论和一些相似方法，如导向滤波比较起来，矩形特征看似有些原始[5,7]。导向滤波等类似方法，非常适合边界的详细分析，图像压缩，纹理分析。相比之下矩形，边缘，，以及其他简单的图像结构，是相当粗糙。垂直，水平和对角线。矩形特征的做不过提供了丰富的图像，支持有效的学习。，矩形。3.自学式分类功能给定一个特征集和一个包含正图像和负图像的训练集，任何数量的机器学习方法可以用来学习分类功能。在我们的系统中，使用AdaBoost的一种变种来选择小规模