鲁棒性实时物体检测(adaboost).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
鲁棒性实时物体检测 概要 这篇论文描述了一个在保证高检测率的前提下非常快速处理图像的可视化物体检测框架。它有三个关键贡献。第一,介绍了一种新的图像表达方式,叫做“积分图像”,这种方法大大加快我们的检测计算。第二,提出了一种可学习算法,基于adaBoost,它是一种通过选择一些重要的可视化特征来产生非常有效的分类器。第三个贡献是在一个级联器重合并多个分类器,使得背景区域的图像被快速丢弃,这样可以把更多计算放在像检测物体的区域上。在人脸检测方面已经进行了一系列实验。这个系统跟之前最好的系统的性能都要好。它可以在常规的桌面系统上达到15帧/s的处理速度。 介绍 这篇论文为构建一个鲁棒性快速物体检测的系统框架带来了新算法和思路。直到最后,我们已经构建了一个正面的人脸检测系统,它的检测率和错误判对率比充分证明比之前已经公布的所有结果都要好的多。在PIII的机器上,对384×288的图片进行检测能达到15帧/s的速度。在其他的人脸检测系统上,辅助信息,如相邻视频序列中的图像差异,彩色图片的像素颜色,已经能够达到比较高的检测速度。但我们的系统是对灰度图进行检测,从而达到更高的检测速度。 我们这个物体检测框架提出了三点重要内容。我们将简要地介绍这些然后在后面的章节中详加叙述。 一种新的图像表达方式称为积分图像,它允许进行快速的特征计算。受papageorgiou等人的启发,我们的检测系统并不直接采用图像积分。像他们一样,我们用了Haar基础函数来回顾一些特征(尽管我们会用比Haar过滤器更复杂的过滤器函数)。为了快速计算这些特征,我们用积分图像的方法(这种方法其实就是将一个图像区域的像素简单地累加起来)。通过计算之后,任何其他位置的Haar特征可以在常量时间内完成计算。 本文提出了用adaboost方法选择一小部分重要特征来构筑分类器。任何的图像的子窗口的haar特征的数量非常的大,远远超过像素的数量。为了确保快速的分类,学习过程必须排除大量的特征,并集中到小部分的重要特征上。受Tieu和Viola的影响,特征选择通过一个简单修改过的AdaBoost过程:“弱学习器被限制住,这样每个弱分类器返回结果只会依据一些简单的特征。这样在每一步的提高过程中,选取一个弱分类器可以看成是特征选取过程。AdaBoost提供了一个有效的学习算法和高边界性能。 将分类器呈级联的结构合并起来使得集中注意到可能出现检测物体的区域来提高速度。将更复杂的处理过程保留给那些可能的区域。这个关键的测量就是集中过程的负例检错率。 我们将叙述一个算法用来训练一个简单有效的分类器作为注意力集中操作的监督。监督这个术语涉及到一个检测一种特殊类型的样本的训练操作。在人脸检测区域,通过20条简单命令操作的分类器,它能达到小于1%的负例判错率和40%的正例判错率(正例判错是指人脸区域但没有检测出来)。而且这个过滤器将筛选掉近一半的数据。 那些没有被初始分类器过滤掉的子窗口将被提交给一连串的分类器,它们每一个都比前一个稍微复杂一点。一个子窗口一旦被过滤掉,将不再得到处理。级联检测的结构从本质上来说是一棵递减的决策树。 完整的人脸检测包含32个分类器,总共80000个操作。然而这种级联结构可以得到非常快的检测速度。在一张复杂的图像上,包含507张人脸和7500万个子窗口,每个子窗口用了平均270条微处理命令。 1.1 总述 论文的下面部分讨论检测的实现,相关理论,和实验结果。第二部分将详述特征的形式和快速计算的方案。第三部分将讨论如何将这些特征合并起来形成一个分类器。机器学习方法用了adaboost变量,同时它也可以作为特征选择机制。虽然以这种方式构建的分类器拥有良好的性能,但作为实时应用的分类器仍然相差甚远。第四部分描述了如何将分类器级联起来组成一个可靠有效的物体检测器。第五部分给出了大量实验结果,包括我们这个实验方法的具体描述。最后第六部分包含系统和相关系统之间关系的讨论。 图表1:所示为待检测窗口中的矩形特征范例。灰色部分的像素和减去白色部分的像素和。双矩形特征如(A),(B)所示。三矩形特征如(C)所示,四矩形特征如(D)所示。 2 特征 我们这个物体检测算法是基于简单特征的值。有很多的原因促使我们使用特征而不是直接使用像素。最主要的原因因为特征本身可以提供对图像中的区域特征的编码方式。还有个原因就是选出的特征数量会远远小于图像中像素的数量,所以基于特征的系统明显要比基于像素的系统快。 这些简单的特征通过Haar基本函数来计算。更明确地说,我们有三种特征,也就是图表1中所示的3种矩形特征。 假设基本的检测矩形是24×24,那么所有的矩形特征是非常的庞大,有45396个。 积分图 (Integral Image) 针对已经引入的矩形特征,为了进一步降低所需要的计算成本我们引

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档