人脸检测中的训练集优化-人脸;如果存在,则返回其位置和.PDFVIP

人脸检测中的训练集优化-人脸;如果存在,则返回其位置和.PDF

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人脸检测中的训练集优化-人脸;如果存在,则返回其位置和.PDF

摘 要 人脸检测(Face Detection )是指任意给定一幅图像,判定该图像中是否存在 人脸;如果存在,则返回其位置和大小。该研究具有重要的科学意义和巨大的应 用价值,一些相关的应用主要包括:人机交互、人脸识别和人脸数据库的管理, 特别是与安全领域相关的视频监控等。 经过三十多年的发展,一系列基于统计学习的人脸检测方法取得了长足进步 并得到了广泛应用。但是所有这些基于统计学习的方法的性能都在很大程度上依 赖于训练集合的优劣。因此,研究者们往往不得不花费大量的精力来收集具有足 够代表性的人脸和非人脸样本集合。但我们却注意到,在收集到一个特定的样本 集合后,研究人员的主要精力就转移到了特征提取和分类器设计方法上,却较少 关注所收集的样本集合是否合理以及如何对其进行自动优化等重要问题。基于 此,本文专门针对样本集自动优化问题开展研究,重点探讨了通过重采样来优化 人脸检测训练集规模和样本分布的方法。主要贡献总结如下: (1) 提出了基于遗传算法的人脸样本扩张方法 首先提出了一种基于遗传算法(GA :Genetic Algorithm )的人脸样本扩张方 法,用来对收集的人脸样本集合进行数量上的优化。具体地说,首先通过手工收 集一定数量的人脸样本作为GA 的初始种群,然后该初始种群进行繁殖(交叉和 变异)。具体的繁殖过程是将人脸样本划分为一些具有一定语义的子块(如眼睛, 鼻子等)来进行交叉和变异;对于变异算子,本文还采用了人脸重加光等技术, 用来丰富样本集合的多样性。这样经过繁殖不断生成新的后代,为了实现后代的 “优胜劣汰”,本文在繁殖的过程中采用分类器 SNoW (Sparse Network of Winnow )来对新生成的后代进行评价。每次经过SNoW 评价后留下来的解和初 始种群一起构成下一代的父代,进行新一轮的繁殖。为了配合人脸样本集合的迭 代优化,该分类器 SNoW 每经过一次 GA 迭代都用初始种群和上一代中经过 SNoW 评价后留下来的后代来重新训练,再用新训练得到的分类器评价下一代的 解。为了确定GA 迭代的终止条件,在GA 迭代过程中每代训练的分类器SNoW 都在校验集上进行测试,并比较得到的结果,当相连几代训练的分类器性能差异 缩小到预先指定的一个阈值时即可停止迭代。实验表明GA 可以在繁殖40 代后 终止,训练集合在数量上也得到了大幅度的扩张,而且数量优化的训练集合可以 显著地提高分类器性能。 (2) 提出了基于流形的训练集分布优化方法 GA 繁殖会使得后代的人脸样本数量急剧膨胀,为了控制后代的规模,需要 对其进行下采样;同时GA 生成的后代样本集的分布也需要优化。由于人脸数据 分布的非线性,本文采用流形(Manifold)的方法来对GA 生成的后代样本集合进 行下采样和分布优化。其大致的思想是先利用Isomap(Isometric Feature Mapping ) 对GA 繁殖的后代进行流形学习,并根据样本对在高维流形空间中的测地距离对 数据集中过于密集的地方进行稀疏化(下采样) ,以删除GA 产生的冗余样本。然 后,基于 Isomap 学习得到的数据集低维流形嵌入,利用 LLE (Local Linear Embedding )算法对该嵌入中较大的空洞进行插值,从而得到一个分布更为合理 的数据流形。实验表明,因为人脸数据的非线性,基于流形优化训练集分布的方 法取得了较好的效果。 (3) 提出了基于支持向量机的训练集边界分布优化方法 通过 GA 和流形等重采样可以对收集的人脸样本集合进行数量上的扩充和 分布上的优化。但是对于分类边界上的人脸样本,由于其适应度值较低,因而容 易在GA 迭代的过程中被抛弃。但是支持向量机(SVM:Support Vector Machine) 的理论表明,分布在类别边界上的样本(即支持向量) ,会在基于边界的分类器学 习算法中发挥重要作用。因此,为了进一步优化通过GA 和流形方法重采样的人 脸样本集合的分布,还需要对人脸样本集的边界进行优化,即织补上那些位于分 类边界上的样本,以使得收集的人脸和非人脸集合的边缘更加清晰。为此,本文 提出了一种基于SVM 的、非线性的训练集边界分布优化算法,即嵌入图像欧式 距离的精简集方法。该算法通过产生边界上的虚拟样本来对人脸和非人脸的边界 处

文档评论(0)

tangtianxu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档