- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于模板匹配与支持矢量机的人脸检测1
梁路宏 艾海舟 肖习攀 叶航军 徐光佑 张钹
(清华大学计算机系,智能技术与系统国家重点实验室,北京 100084 )
摘要 人脸检测是人脸识别与基于内容的图像及视频检索的一项重要任务。由于非人脸本相对于
人脸样本的多样性和复杂性,使得人脸模式分类器的训练十分困难。本文提出了一种将模板匹配
与支持矢量机 (SVM )相结合的人脸检测算法。算法首先使用双眼—人脸模板对进行粗筛选,然
后使用 SVM 分类器进行分类。在模板匹配限定的子空间内采用“自举”方法收集“非人脸”样
本训练 SVM,有效地降低了训练的难度。实验结果的对比数据表明,该算法是十分有效的。
关键词 人脸检测,匹配,支持矢量机,模式分类
1. 引言
人脸检测是指在图片中确定人脸的位置及大小的过程,它作为人脸信息处理的一个重要研究
内容,是当前计算机视觉与模式识别领域的研究热点之一。人脸检测在智能人机接口、视觉监测、
图象标注与检索、数字视频分析等诸多应用领域有着非常广泛的实用价值。尽管人脸是自然界中
具有很强共性的一种三维形体,但是由于外貌、表情以及光照等因素的影响,它的图象具有复杂
而细致的模式变化,使人脸检测成为一个极具挑战性的模式分类问题,具有十分重要的学术价值。
目前在人脸检测方面的研究,按照图片的类型可分为彩色图片和灰度图片。前者可利用肤色
分割限定搜索区域[1],然后再按照灰度图片来处理,因此可以说人脸检测的关键是灰度图片中的
人脸检测算法。此外,还可以按照人脸的姿态分类,如正面端正人脸,多姿态 (倾斜、侧面等情
况)人脸等。本文讨论灰度图片中正面端正的人脸检测问题。针对此类问题,具有代表性的人脸
检测算法包括基于启发式规则的方法[2]、基于特征脸的方法 [3] 、基于聚类学习的方法[4]和基于
人工神经网的方法 [5]等。
支持矢量机 (Support Vector Machines,以下简称 SVM )是 Vapnik 等人提出的基于结构风险
最小化原理的统计学习理论[6-7],用于分类与回归问题。SVM 方法以其许多引人瞩目的特性和
有前途的实验性能而越来越受到重视。人脸检测是一个典型的复杂的分类问题,如何将 SVM 用
于该问题的研究引起了人们的关注。Osuna 等[8]首先将 SVM 方法用于人脸检测问题,取得了较
好的实验结果。 直接使用 SVM 方法解决人脸检测问题面临两个困难:(1)训练 SVM 需要求解
二次规划问题,计算复杂度高、内存需求量巨大;(2 )在非人脸样本不受限制时,需要极大规模
的训练集合,得到的支持矢量会很多(约占训练样本总数的 20% ),使得分类器的计算量过高。
Platt 提出的 SMO 算法[9]有效地解决了第一个问题,但第二个问题仍然难以解决。针对这一问题,
本文提出了一种将模板匹配与 SVM 方法相结合的人脸检测算法,该算法把模板匹配作为人脸检
测器的粗筛选环节,在模板匹配限定的子空间内采用 “自举(bootstrap )”方法[5]收集 “非人脸”
样本、训练 SVM,有效地降低了训练的难度和最终得到的支持矢量的规模,使得检测速度比单
纯的 SVM 检测器提高二十倍以上。大量实验表明,该算法是十分有效的。在我们建立的测试集
以及在CMU 测试集[5]上的对比实验表明,该算法的检测性能优于Osuna 的 SVM 方法[8],达到
了与CMU 的神经网方法[5]可比较的程度。
2. 人脸检测算法
采用基于样本学习的框架,人脸检测算法如图 1 所示。首先,从训练图片集中手工标定人脸,
经过几何和灰度矫正与变换后,构造出“双眼—人脸”模板对,并形成训练 SVM 用的“人脸”
1 受清华大学骨干教师支持计划(百 005 )和863 计划(863-805-512-9805-11)资助
1
样本集合。在模板匹配限定的空间内采用 bootstrap 方法[5]收集“非人脸”样本,与“人脸”样
本一起通过 SMO 算法[9]训练 SVM 分类器。检测器的工作过程为:输入图象首先经过预处理、
模板匹配和 SVM 分类器各环节的滤波,然后根据局部最优搜索策略定位出各个人脸。
文档评论(0)