基于图像处理人脸检测研究.docVIP

下载本文档

28
0
约5.75千字
约 12页
2018-07-06 发布于福建
举报
版权申诉

基于图像处理人脸检测研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于图像处理人脸检测研究

基于图像处理人脸检测研究　　摘要：针对人脸识别的预处理，采用图像处理技术解决了人脸检测问题。首先建立输入图像的肤色模型，然后进行开运算处理，以消除图像噪声利于后面的眼睛定位。再对二值图像做灰度投影实现人脸粗分割，定位双眼。最后对细化分割出来的人脸区域进行标准化操作，包括灰度的均衡处理和Mallat算法二维小波分解。灰度均衡把原始图像的直方图变换为均匀分布的形式，增加像素灰度值的范围。小波分解可以压缩图像，以降低算法的复杂度。每个步骤通过处理前后人脸图像的对比彰显所做步骤的意义。人脸检测的最终结果是获得64×64大小的人脸图像。此图像包含了人脸的有效信息，在此图像的基础上才能进行后续的提取特征、设计支持向量机，进而做人脸识别。　　关键词：图像处理；人脸检测；灰度均衡；小波分解；肤色建模　　中图分类号：TP391.41 文献标志码：A 文章编号：1672-1098（2014）03-0033-06 　　要识别图像中的人脸，首要的一点就是要找到人脸。人脸检测与跟踪就是研究如何从静态图片或者视频序列中找出人脸的所在区域，如果存在人脸，则输出人脸的位置及其大小。人脸跟踪就是要在检测到人脸的基础上，在后续的人脸图像中继续捕获人脸的位置及其大小等性质。人脸检测是人脸身份识别的前期工作。同时，人脸检测作为完整的单独功能模块，在智能视频监控、视频检索和视频内容组织等方面有直接的应用[1]。　　目前做人脸检测的方法大致有：神经网络的方法、基于特征的方法和基于图像的方法等。其中，神经网络的方法是用许多的训练数据（一部份是脸部的、一部份是非脸部的）去训练神经网络，使其可以辨识出什么图像是脸、什么图像不是脸。基于特征的方法是利用人脸部的一些特征来检测人脸，例如：人脸上有眼睛、鼻子、嘴巴，而这些器官都有固定的相对位置；就整张脸而言，大概是呈椭圆形，而脸和背景之间大致会有边缘线；诸如此类，有许许多多的特征可利用。而基于图像的方法，则是利用人脸部的颜色来判断某图像是否是脸，若图像是彩色的，知道脸的颜色是黄、白、褐、深褐色，若图像是灰度的，人脸的灰度颜色的变化并不会太大，而眼睛、嘴巴、头发会是较黑的部份[2]。　　同灰度图像相比，彩色图像能够提供更多有关于目标物体的信息，彩色图像处理方法具有比灰度图像处理方法更大的优越性。基于图像的方法运算量小，肤色是人脸的重要信息，不依赖于面部的细节特征，对于旋转、表情等变化情况都能适用，具有相对的稳定性并且和大多数背景物体的颜色相区别，因此肤色特征在人脸检测中是最常用的一种特征[3]。　　本课题设计了一套人脸识别的技术路线，仅探讨标准化处理前的人脸检测部分。　　人的皮肤颜色分布在颜色空间中很小的一个范围内，呈聚类特性，特别是在排除了光照亮度和在经过某种变换的色彩空间中。所以利用肤色这一线索，可以排除掉在灰度图像中很像人脸而对应到彩色图像中根本不是肤色的区域，这在人脸检测中会起到积极的作用，肤色模型正是建立在此基础之上的，并且人们提出了不同色彩空间的肤色模型表示方法。常见的色彩表示方法是基于三基色理论的RGB空间，由RGB空间经过变换，可以得到各种色度空间表示，有HIS，YCbCr等[4]。　　CbCr分量组成的二维聚类区域排除了大部分非人脸区域，但由于CbCr是直接由RGB色彩格式通过线性变换得到，没有完全分离出亮度信息，因此对光照比较敏感。肤色聚类呈两头尖的纺锤形状。若只采用二维的肤色CbCr模型，在值较大和较小的部分，被错误检测为肤色的区域将大大增加。在进行肤色建模的时候，YCbCr空间中的亮度和色度的分离度越大越好，但是实际操作中这二者总是存在一定的依赖关系，要做的就是尽量消除它们之间的依赖关系，分段的非线性转换就是为了这一目的。　　2 二值图像开运算和闭运算　　形态学变换膨胀采用向量加法对两个集合进行合并。膨胀XB是所有可能向量加之和的集合，向量加法的两个操作数分别来自于X和B，并且取到任意可能的组合[6]。　　膨胀用来填补物体中小的空洞和狭窄的缝隙，它使物体的尺寸增大。　　腐蚀Θ对集合元素采用向量减法，将两个集合合并，腐蚀是膨胀的对偶运算。　　腐蚀简化了物体的结构，某些物体或物体的部分将被去掉，腐蚀和膨胀不是互逆变换。　　开运算是对图像先腐蚀后再膨胀，得到的不是原始图像。　　根据开启和闭合的特点，通常可以利用开启删除图像中的小分支，利用闭合填补图像中的空穴。用B=111111 　　将经过肤色建模的图像进行开运算处理，消除部分噪声以利于下面的眼睛定位（见图4），可见眼睛所在的区域非常清晰[7]。　　图像分割是一种基本的计算机视觉技术，是从图像处理到图像分析的关键步骤。有效合理的图像分割能够为基于内容的图像检索、对象分析等抽象出十分有用的信息，从而使得更高层的图像理解成为可能[8]