面向视频人脸检测的深度学习算法研究-信号与信息处理专业毕业论文.docxVIP

面向视频人脸检测的深度学习算法研究-信号与信息处理专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 Dissertation Submitted to Hangzhou Dianzi University For the Degree of Master Study on Deep Learning for Face Detection in Video Candidate: Chen Xueting Supervisor: Associate Prof. Ye Xueyi March,2016 杭州电子科技大学 学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明: 所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得 的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过 的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 日期: 年 月 日 学位论文使用授权说明 本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或 使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件, 允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其 它复制手段保存论文。(保密论文在解密后遵守此规定) 论文作者签名: 日期: 年 月 日 指导教师签名: 日期: 年 月 日 杭州电子科技大学硕士学位论文 杭州电子科技大学硕士学位论文 摘 要 人脸检测是人脸识别、表情分析、人脸跟踪等人脸信息处理前提和基础。随着视频监控 覆盖面的不断扩大,人脸监控所具有的不易被观测对象发现的显著优势使得视频人脸检测被 越来越多的应用在了犯罪分析、智慧安防、人工智能等领域。现有的视频人脸检测算法在处 理非理想条件(包括背景复杂、光照影响、人脸旋转等等)下的检测问题,往往仅针对其中 某种情况有较好的效果,当多种非理想条件并存时,检测性能急速下降。而实际的视频信息 中多种非理想条件并存是常态,因此针对这种复杂条件下的视频人脸检测,本文引入深度学 习理论并结合视频帧间的连续性,探讨具有较强鲁棒性、误检率和漏检率低,且检测速度快 的方法,以期为智能监控及智慧安防提供基础支持。具体研究内容如下: 首先,以深度学习理论和人脸检测神经网络为基础,提出一种级联型概率态受限玻尔兹 曼机学习网络以实现视频单帧的人脸检测。它首先利用概率态受限玻尔兹曼机(Probability state-Restricted Boltzmann Machine,P-RBM)中神经元的概率表征来模拟人脑神经元所具有的 连续分布激活状态,然后通过级联多个 P-RBM 构建深度学习检测网络来仿真人脑对视觉的 层次学习模式,并以逐层递减隐藏层神经元数来控制网络规模,最后采用分层训练和整体优 化的机制来缓解鲁棒性和准确性的矛盾。该算法利用学习网络在充分提取输入数据各层次特 征的基础上建立从底层特征到高层语义的映射,继而获得输入数据的语义信息以准确地完成 检测任务。 其次,上述这种面向视频单帧的人脸检测并未利用视频特有的帧间连续性信息。因此, 在上述研究基础之上,进一步研究视频帧间的连续性,提出多帧间信息融合的视频人脸检测 算法。针对视频单帧的人脸检测结果,它首先利用人脸肤色区域长宽比去除部分误检区域, 其中长宽比允许范围的设定采用自适应更新方式以获得检测视频最适宜的边界条件,然后通 过视频帧间人脸位置变化规律估计当前帧的检测结果,并与真实检测结果进行对比,利用对 比规则对检测结果进行修正,删去误检区域,补上漏检区域,提高算法的检测准确率。 实验数据表明,面向视频单帧人脸检测的级联型 P-RBM 学习网络不仅能实现较低漏检 率和误检率的人脸检测,同时对旋转人脸的检测具有较强鲁棒性。另外,其检测速度较快, 基本能满足实时检测的要求;将其与多帧间信息融合算法相结合实现的视频人脸检测不仅保 持了原有的较快检测速度和较低误检率,同时显著降低了漏检率,还提高了对部分被遮挡人 脸的检测性能。 关键字:视频人脸检测,深度学习,概率态受限玻尔兹曼机(P-RBM),多帧间信息融合 I ABSTRACT As the primary technology to extract information from face, face detection is the premise and foundation of face recognition, facial expression analysis and face tracking. At the same time, face monitoring has a

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档