- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人脸检测中的训练集优化-人脸;如果存在,则返回其位置和.PDF
摘 要
人脸检测(Face Detection )是指任意给定一幅图像,判定该图像中是否存在
人脸;如果存在,则返回其位置和大小。该研究具有重要的科学意义和巨大的应
用价值,一些相关的应用主要包括:人机交互、人脸识别和人脸数据库的管理,
特别是与安全领域相关的视频监控等。
经过三十多年的发展,一系列基于统计学习的人脸检测方法取得了长足进步
并得到了广泛应用。但是所有这些基于统计学习的方法的性能都在很大程度上依
赖于训练集合的优劣。因此,研究者们往往不得不花费大量的精力来收集具有足
够代表性的人脸和非人脸样本集合。但我们却注意到,在收集到一个特定的样本
集合后,研究人员的主要精力就转移到了特征提取和分类器设计方法上,却较少
关注所收集的样本集合是否合理以及如何对其进行自动优化等重要问题。基于
此,本文专门针对样本集自动优化问题开展研究,重点探讨了通过重采样来优化
人脸检测训练集规模和样本分布的方法。主要贡献总结如下:
(1) 提出了基于遗传算法的人脸样本扩张方法
首先提出了一种基于遗传算法(GA :Genetic Algorithm )的人脸样本扩张方
法,用来对收集的人脸样本集合进行数量上的优化。具体地说,首先通过手工收
集一定数量的人脸样本作为GA 的初始种群,然后该初始种群进行繁殖(交叉和
变异)。具体的繁殖过程是将人脸样本划分为一些具有一定语义的子块(如眼睛,
鼻子等)来进行交叉和变异;对于变异算子,本文还采用了人脸重加光等技术,
用来丰富样本集合的多样性。这样经过繁殖不断生成新的后代,为了实现后代的
“优胜劣汰”,本文在繁殖的过程中采用分类器 SNoW (Sparse Network of
Winnow )来对新生成的后代进行评价。每次经过SNoW 评价后留下来的解和初
始种群一起构成下一代的父代,进行新一轮的繁殖。为了配合人脸样本集合的迭
代优化,该分类器 SNoW 每经过一次 GA 迭代都用初始种群和上一代中经过
SNoW 评价后留下来的后代来重新训练,再用新训练得到的分类器评价下一代的
解。为了确定GA 迭代的终止条件,在GA 迭代过程中每代训练的分类器SNoW
都在校验集上进行测试,并比较得到的结果,当相连几代训练的分类器性能差异
缩小到预先指定的一个阈值时即可停止迭代。实验表明GA 可以在繁殖40 代后
终止,训练集合在数量上也得到了大幅度的扩张,而且数量优化的训练集合可以
显著地提高分类器性能。
(2) 提出了基于流形的训练集分布优化方法
GA 繁殖会使得后代的人脸样本数量急剧膨胀,为了控制后代的规模,需要
对其进行下采样;同时GA 生成的后代样本集的分布也需要优化。由于人脸数据
分布的非线性,本文采用流形(Manifold)的方法来对GA 生成的后代样本集合进
行下采样和分布优化。其大致的思想是先利用Isomap(Isometric Feature Mapping )
对GA 繁殖的后代进行流形学习,并根据样本对在高维流形空间中的测地距离对
数据集中过于密集的地方进行稀疏化(下采样) ,以删除GA 产生的冗余样本。然
后,基于 Isomap 学习得到的数据集低维流形嵌入,利用 LLE (Local Linear
Embedding )算法对该嵌入中较大的空洞进行插值,从而得到一个分布更为合理
的数据流形。实验表明,因为人脸数据的非线性,基于流形优化训练集分布的方
法取得了较好的效果。
(3) 提出了基于支持向量机的训练集边界分布优化方法
通过 GA 和流形等重采样可以对收集的人脸样本集合进行数量上的扩充和
分布上的优化。但是对于分类边界上的人脸样本,由于其适应度值较低,因而容
易在GA 迭代的过程中被抛弃。但是支持向量机(SVM:Support Vector Machine)
的理论表明,分布在类别边界上的样本(即支持向量) ,会在基于边界的分类器学
习算法中发挥重要作用。因此,为了进一步优化通过GA 和流形方法重采样的人
脸样本集合的分布,还需要对人脸样本集的边界进行优化,即织补上那些位于分
类边界上的样本,以使得收集的人脸和非人脸集合的边缘更加清晰。为此,本文
提出了一种基于SVM 的、非线性的训练集边界分布优化算法,即嵌入图像欧式
距离的精简集方法。该算法通过产生边界上的虚拟样本来对人脸和非人脸的边界
处
您可能关注的文档
- 五邑大学教师实践教学总结表.doc
- 亚洲协会香港中心宣布委任行政总监.PDF
- 交易系统风险初探、模型组合.PDF
- 交流专题调研成果.PDF
- 交通费、住宿费、伙食补助费标准一览表.doc
- 交通银行信用卡「生活影音、生活电器、生活数码及伟明电业.PDF
- 产后泌乳评价指标的探讨.PDF
- 产品描述-光缆线路自动监测系统.doc
- 产品销售返点为如果合作伙伴在活动周期内向总代理下单,.PDF
- 产权结构与环境资源优化配置.PDF
- 新能源环卫车辆采购与运营管理一体化解决方案:2025年行业报告.docx
- 新能源环卫车辆采购与运营管理优化方案研究(2025年).docx
- 新能源环卫车辆采购与调度成本效益分析及行业趋势研究.docx
- 新能源环卫车辆采购与运营效益最大化策略:2025年研究报告.docx
- 金融开放促进区域金融服务贸易协同发展.docx
- 2025年工业互联网平台安全漏洞风险评估与风险控制报告.docx
- 智能化升级助力城市慢行交通:自行车与步行系统2025年发展策略报告.docx
- 制造业质量管控供应链管理优化研究报告.docx
- 聚焦2025:创业孵化基地建设资金申请与创业孵化项目筛选报告.docx
- 电商直播行业用户满意度2025年数据复盘分析报告.docx
文档评论(0)