- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于全局扫描并验证策略的自动人脸分类方法
在过去10-20年内,人类信息的处理已经成为计算机视觉和模式识别领域的研究热点。作为面部的主要部分,人体器官(眼睛和嘴巴)以及状态(打开和关闭)包含了丰富的面部表情和情感信息。许多面部视觉系统都包含重要的应用,如疲劳驾驶检测、活动验证、面部表情分析等。
但是一直以来,人脸器官状态识别并没有引起大家足够的重视,也没有专门的、系统的文献报道.仅有的少量的研究存在于某些人脸分析系统中,被当作一个子问题来对待,这些研究也通常是一些经典的模式识别方法的简单应用.以眼睛为例,Chu等在研究驾驶员的疲劳检测中,采用一个3层的BP网络来进行眼睛睁闭分类,他们采用的特征是一个由6个几何参数(眼宽、眼高以及4个弧度参数)构成的6维向量,在一个自建的包含124张图片的数据集上取得了85%的正确率;类似地,Tian等也采用神经网络来进行分类,但抽取的特征是包含眼睛区域纹理的Gabor变换系数,在一个自建的数据集上获得了93%的正确率;邓刚等在研究活性判别算法中,使用支持向量机来对直方图均衡化后的人眼灰度块直接分类,他们采用大约1 300张图片进行实验,根据选择的核函数不同,支持向量的个数在60~200之间,分类正确率在90%~97%之间:这些方法大多假设特征点定位非常准确或者直接采用手工标定的特征点,而这对通常的自动定位系统来说比较困难.除了分类的方法以外,还有一类基于检测的方法. Veeraraghavan等在检测驾驶员疲劳的研究中,使用基于模板匹配的方法直接检测睁眼和闭眼,模板共有4种:左眼睁模板,左眼闭模板,右眼睁模板和右眼闭模板,该方法的正确率达到85%以上.
本文系统地比较了一些经典的机器学习方法,包括Fisher线性鉴别(fisher linear discriminant, FLD)分析,支持向量机(support vector machine, SVM),以及基于Haar型矩形特征的Adaboost算法.实验表明,在手工标定特征点的测试集合上,3种经典的分类算法都取得了非常高的分类正确率.然而在自动定位特征点系统中,3种分类算法的分类正确率都大幅度下降.究其原因我们发现这是因为3种分类算法都对特征点的位置非常敏感,有时甚至1~2个像素的偏差可能导致完全相反的结果.一些简单的思想,如扰动并投票、统计特征点定位的误差分布等,可以在一定程度上缓解这个问题,但并不能令人满意.为了从根本上解决特征点定位不准的影响,本文提出一种全局扫描并验证的策略,其基本思想就是在包含器官的一个大块区域中对所有的子窗口扫描并逐个判断其状态.为了快速、高效地实施这种策略,受Viola等的人脸检测工作的启发,我们采用Cascade结构来组织分类器,采用Adaboost方法学习分类器.实验表明,这种方法无论鲁棒性强、正确率高而且速度快,具有非常明显的实际应用价值.
为方便叙述,本文的论述都以眼睛为例,嘴的分类技术完全一样,只是样本不同而已.本文系统采用同样的算法实现了眼和嘴部状态的分类.
1 基于adabsost的人脸状态分类方法
人眼状态自动分类系统的一般框架包括如下几个步骤:给定一幅包含人脸的图像或者视频序列,首先需要在其中检测出人脸,然后定位人脸特征点,再提取人眼样本,最后进行人眼状态自动分类,如图1所示.在本文系统中,人眼状态分为闭眼和睁眼2类.
我们只考虑正面人脸的眼睛状态分类.由于正面人脸检测问题已经基本得到解决,最具代表性的工作是Viola等提出的基于Haar型矩形特征,使用Adaboost方法得到的瀑布型分类器,我们也采用类似的方法进行人脸检测.人脸特征抽取过程使用基于纹理到形状映射的方法,它抽取出6个特征点的位置(双眼眼角和嘴角),其中双眼眼角的位置用于人眼样本的定位和提取.在本文中仅详细讨论人眼状态分类模块.
2 人脸检测算法实验
我们实验并比较了SVM,FLD和基于Haar型矩形特征的Adaboost算法.实验的过程如下:首先在一个手工标定了6个特征点(双眼眼角和嘴角)人脸图片的集合上,根据2个眼角的位置提取正方形人眼区域,宽度为人眼实际宽度,并且眼角连线上半部分和下半部分的比例为2∶3(根据经验);然后进行灰度校正;最后缩放到24×24像素大小,得到样本集,将灰度向量直接作为特征向量.我们的实验是在一个自建的包含3 500张人脸图片集上进行,数据集包含约350个人,男女数量相当,人种为亚洲人,年龄在15~70岁之间,室内光照分辨率较低.图片大小为240×320像素,人脸宽度大约200像素,其中1 500张闭眼人脸和2 000张睁眼人脸,全部经过手工标定好6个特征点.通过水平镜像将右眼翻转成左眼,一共切割得到3 000个闭眼样本和4 000个睁眼样本,我们挑选出1 000个闭眼样本和1 000个睁眼
文档评论(0)