- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于最大区域不同值唇角检测方法
一种基于最大区域不同值的唇角检测方法
摘要:唇动检测中的唇角定位容易受光照、胡须以及嘴型的影响,针对这一问题,本文改进了一种基于最大区域不同值的唇角检测方法,在对图像利用彩色滤波器进行预处理的基础上进行边缘检测,利用窗口搜索得到候选唇角,然后设计了候选唇角筛选器进行初步筛选,提高了唇角定位的检测速度,同时引入聚类方法对候选唇角进行分类,解决了以前方法中由于阈值难以确定带来的问题,最后通过取最大区域不同值来定位左右唇角。
关键词:唇角检测 最大区域不同值 彩色滤波器 边缘检测 筛选器 聚类
0 引言
在人与人的交流中,人们对于他人讲话的内容不仅仅需要通过声音来感知,往往还需要眼睛观察其口型,表情等的变化,才能准确地理解对方所讲的内容。双通道(语音视觉)的感知效果相比单一的语音通道大大提高了人们对说话者语义的理解,特别是在喧闹的环境中,视觉信息能够弥补语音信息的不足,有效的改善识别率;在无噪声干扰的环境中,视觉信息能够提高语言的感知性能。
近年来,越来越多的研究者开始综合利用听觉和视觉特征来对语音进行处理和识别以及开展综合唇动技术的研究。在语音的视觉信息中以嘴型的变化对发音的影响最为重要,唇动检测与识别是视觉语音研究的主要内容,这个方向称为唇读(lip-reading)。唇动视觉信息能够提高语音识别系统的精确性和鲁棒性,因此,与唇相关的视觉特征的精确提取显得非常重要了。
在特征提取和模式分类之前应该先定位唇部的感兴趣区域(ROI)。现有的定位嘴唇的方法有:主轮廓模型(active contour models)、强度投射(intensity projection)、冒充颜色(pseudo hue)或统计模型(statistical models)如:主动形状模型(active shape models)。本文将通过唇角的检测来精确定位感兴趣的唇部轮廓区域,并且把检测到的唇角点作为特征提取过程中的特征点。这种方法的基本思想是:定位眼睛或嘴的最明显的特征就是角点。以往对唇角的检测大都是根据脸部特征部位的几何关系,先确定眼睛的位置,再利用眼睛的精定位及嘴与眼球的几何关系,在二值图像中对嘴纵坐标附近的水平带条区域做垂直灰度投影来实现嘴左右边界的标定,然后通过平滑滤波,寻找有效波谷,得到嘴角的位置。这种方法得到的嘴角定位不是很准确,很容易受干扰,且复杂度较高。本文将采用一种改进的利用最大区域不同值的方法来进行唇角检测与定位。
1 唇部图像的预处理
唇角检测的第一步就是要进行人脸定位,本文采用的是Viola 和Jones提出的Haar分类器法,利用AdaBoost分级分类器来快速的进行人脸检测。用这种方法检测出来的人脸,识别效果好、实时性好、检测速度快,而且是用OpenCV实现的,开发周期短,应用前景广阔。
由于唇色和肤色很相近,再加上光照、胡须等因素的影响,要想把唇部从人脸图像中准确的提取出来是很困难的,因此,人们就想办法使唇部颜色明显的突出出来。通过对彩色空间中各分量的分析发现,色度信息相比亮度信息较稳定,这也是唇色和肤色的一个重要特征,因此本文将利用色度信息来增强唇色。
彩色滤波器实现唇色增强
根据人脸的几何特征,唇大约在人脸的下三分之一位置,本文取人脸的下三分之一作为研究区域,这样就大大减少了搜索的范围,节省了时间。
综合运用Red Exclusion和有约束的Fisher线性判别的方法,可以使唇色增强,然后用自适应确定阈值的方法得到唇部轮廓。但是通过这种方法分离出来的唇色和肤色有一部分重叠的区域。本文将利用色度滤波器来使唇色增强,用YUV彩色空间中的U,V分量来设计一唇色滤波器如下:
Z=0.407U+0.914V-27(1)
又因为RGB与YUV之间的转换关系为:
所以(1)式可化为:
Z=0.502R-0.588G+0.090B-27(3)
滤波后的灰度值F的计算表达式为:
其中Z0为滤波中心,r为滤波半径。经过滤波之后的图像唇部就明显的突出出来,相比通过Fisher变换增强嘴唇区域的技术唇色和肤色的分界面更明确,这为下一步进行边缘提取提供了保证。
2 唇角检测
2.1 窗口搜索确定候选角点
首先对所研究的图像区域进行边缘检测,由于之前对图像进行了滤波,唇色增强,所以边缘检测就变得容易了。本文用的是OpenCV中自带的Canny边缘检测法,每一条被检测出来的边缘都被看作是构成角点的候选线。用一个窗口沿着边缘图像来寻找构成角点的一对候选线。假设一条线始于这个窗口的中心点,可以定义很多条过这个中心点的线,如果在这个窗口中存在2条或2条以上的线始于这个点,那么,就可以把这个中心点当作角点来处理。
您可能关注的文档
最近下载
- 2025年度村镇(社区)后备干部选拔考试题(附答案).docx VIP
- 企业员工入职登记表.pdf VIP
- 变电站综合自动化系统.docx
- 机电安装工程安全技术交底.docx VIP
- 压缩空气储能.pptx VIP
- 曹冲称象的故事(1)(课件)2025-2026学年度人教版数学三年级上册.pptx VIP
- 【絮语文】2025年高考全国二卷语文试题讲评课件.pptx
- 中职高教版(2023)世界历史全一册第8课 欧美主要国家的资产阶级革命与资本主义制度的确立 教案 .pdf VIP
- T/CI 218-2023压缩空气储能电站选点规划技术规程.pdf
- 2025年党建工作汇报总结及新年党建计划思路PPT模板.pptx VIP
文档评论(0)