- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
针对自拍视频眼睛图像校正研究
针对自拍视频眼睛图像校正研究
摘 要:提出一种自拍视频中眼睛的校正方法,通过以下3个步骤:目标眼睛的检测和定位;眼睛中巩膜、虹膜和瞳孔图像的识别和定位;虹膜图像和瞳孔图像的二次投影,实现了在视频自拍和网络视频过程中,当使用者在注视显示装置而不正视捕获装置时,能够在显示装置上获得使用者正视视频的活动视频图像。
关键词:人脸检测; 人眼检测; 眼睛调正; 网络视频
中图分类号:TN91934 文献标识码:A 文章编号:1004
随着3G通信网络的普及,传统的语音聊天和通话将逐渐成为辅助手段,视觉冲击力强,快速直接的视频自拍和视频通话等应用无疑将成为主流。而目前在实际应用中存在一个亟待解决的问题,就是视频采集装置一般位于显示装置的外边缘附近,导致当被拍摄人目光注视显示装置的屏幕时,显示装置上的成像结果是被拍摄人的眼睛注视点偏离显示装置的屏幕,即屏幕观察者获得的人脸显示图像中眼睛图像是非正视的,这无疑是视频系统的一个缺陷。由此,本文提出自拍视频中眼睛的调正系统,在不增加额外装置的情况下,通过软件方法进行图像处理,大大降低了硬件系统的改进成本。
1 目标眼睛的检测和定位
1.1 预处理工作
由于图像的采集往往在多变的,不可预料的环境(主要是光照环境)下进行,对图像进行预处理使其归一化以适应算法的要求显得尤为必要。本文分别采用了直方图均衡化处理以增强局部的对比度;中值滤波处理以平滑噪声;在有必要的情况下进行亮度补偿处理。
1.2 基于肤色分割的人脸检测
为了缩小眼睛检测范围、提高检测准确度,首先定位人脸区域。本文利用准确度较高且处理速度可接受的高斯肤色模型[13]实现人脸检测。
长期研究实验表明,利用YCbCr色彩空间进行肤色分割优势十分明显,在该空间内,肤色Cr分量的阈值易于选取,且受到光照影响很小,同时还降低了色彩空间的维数,即降低了计算复杂度。因此选取YCbCr色彩空间作为肤色分布统计的映射空间,根据人脸肤色在该空间的统计分布特性提出基于相似度的人脸检测算法。
下面确定二维高斯模型G(m,C)中的未知参数:m=(Cr,Cb)T
(1)
Cr=1N∑Ni=1Cri
(2)
Cb=1N∑Ni=1Cbi
(3)
C=E[(x-m)(x-m)T]
= σC2r σCb,Cr
σCr,Cb σC2b
(4) 式中:x是每个像素点的色度向量,第1个分量是Cr,第2个分量是Cb,m和C分别是统计出来的均值和方差。经过实验统计,均值和方差分别为:m=(156.559 9,117.436 1)
(5)
C=299.457 412.143 0
12.143 0160.130 1
(6) 根据已建立的肤色模型,计算人脸图像点颜色和肤色的可能性大小,即相似度大小,其取值范围为[0,1],相似度计算如式(7)所示:P(Cr,Cb)=exp[-0.5(x-m)TC-1(x-m)]
(7)式中x=[Cr,Cb]T为像素点在CbCr空间中的向量。
通过对相似度进行阈值分割,将YCbCr彩色图像转化为黑白图像,黑色表示背景,白色标记了接近肤色的区域。
再通过形态学闭运算加强脸部区域中各个分散点的连通性。最后,在所有被找到的白色区域中,通过面积,长宽比,位置等信息筛选出最有可能是人脸的区域。
1.3 目标眼睛的定位
通过人脸面部的几何特征规则,可以迅速粗略检测出眼睛所在区域。根据人眼灰度变化非常明显这一特征,本文通过计算候选眼睛对的灰度复杂度来进行更为精确的定位,具体算法如下。
假设检测出的图像块,每块总共m行n列,则图像块的复杂度Com(k)的计算公式定义如下:
Com(k)=∑ni=1∑m-1j=1|Bi,j+1-Bi,j|min(j,m-j)
(8)
式中Bi,j为图像块第i列第j行像素点的灰度值。
此图像块的复杂度公式Com(k)计算了图像块灰度值的纵向一阶加权导数,min(j,m-j)即为权,离图像中心越近导数的权越大,横向坐标没有加权。实验证明,这种定义符合人脸特征器官复杂度的计算。类似的也可以有横向一阶加权导数。但是通过实验发现人眼的纵向一阶加权导数大,所以采用图像块灰度值的一阶纵向加权导数[4]。
计算候选眼睛块的图像复杂度,根据人眼灰度变化非常明显这一特征,找出复杂度最大的两小块,即为要找的眼睛块。寻找一只眼睛块的效果如图1所示。
由于已经得到左右两只眼睛的区域块,此后所有步骤都可利用多线程技术,并行处理两只眼睛,大大提高了运行效率。为叙述方便,下文中都以处理一只眼睛为例,不再赘述。
2 巩膜、虹膜和瞳孔的识别和定位
2.1
原创力文档


文档评论(0)