基于LBP及统计直方图和SIFT特征改进的人脸检测讲解.docx

基于LBP及统计直方图和SIFT特征改进的人脸检测讲解.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于LBP及统计直方图和SIFT特征改进的人脸检测 1 引言 1.1 研究背景 局部二进制模式( LBP) 是一种理论简单、计算高效的非参数局部纹理特征描述子。由于其具有较高的特征鉴别力和较低的计算复杂度,因此近期获得了越来越多的关注,在图像分析、计算机视觉和模式识别领域得到了广泛的应用,尤其是在纹理分类和人脸识别两个经典的模式识别问题中。 1.2 研究内容 首先, 简要概述了LBP方法的原理, 主要分析了LBP方法中的阈值操作并介绍了统一模式和旋转不变性模式。本文提出了基于分块的完备局部二值模式的人脸识别算法。首先,将人脸图像进行分块,然后对每一分块分别利用全局阈值对中心像素灰度值进行二进制编码。 与基本LBP算子相比,本文增加了对中心像素灰度值和局部差异的幅度值进行编码,提取了丰富的局部特征,完善了基本LBP算子提取的特征,尽管LBP方法在早期的应用实验中取得了不错的效果, 但是在不同领域的具体应用中, 该方法所获得的结果还不能令人满意, 所以在近些年的研究中, 许多学者都在具体应用中对LBP进行改进。 1.3 应用现状 在计算机视觉和数字图像处理之中, 图像特征的表示与获取是一项非常重要的基础性工作. 在常用的颜色特征、纹理特征、形状特征和空间关系特征中, 纹理特征的提取在分析自然图像的应用研究中占有非常重要的地位。因此, 如何有效获取纹理特征信息是图像特征提取问题的研究重点。 2 相关技术名词简述 2.1 灰度化 在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。一般有分量法、最大值法、平均值法、加权平均法四种方法对彩色图像进行灰度化。 2.2 旋转不变性 旋转不变性用到物体就是指一个物体和模板物体相同角度时可以识别出来,如果这个物体旋转一定角度后还可以识别出来,那么你所采用的这种识别算法就具有一定的旋转不变性,不同算法旋转不变性的角度可能是不同的,可以具有360度旋转不变。 2.3噪声 噪声通常指任意的随机干扰。热噪声又称白噪声或约翰逊噪声,是由处在一定温度下的各种物质内部微粒作无规律的随机热运动而产生的,常用统计数学的方法进行研究。热噪声普遍存在于电子元件、器件、网络和系统中,因此噪声测量主要指电子元件和器件、网络和系统的热噪声和特性的测量。 2.4仿射变换 仿射变换(Affine?Transformation或?Affine?Map)是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(即:直线经过变换之后依然是直线)和“平行性”(即:二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变)。 2.5 SVM分类器 支持向量机(support vector machines,SVM)是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。 3 基于LBP及统计直方图特征提取人脸检测改进 3.1 LBP简述 3.1.1 LBP概念综述 我们对传统意义的LBP(Local Binary Pattern,局部二值模式)有关概念及其特征原来进行综述: 1) 传统LBP(Local Binary Pattern,局部二值模式): 是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征。 原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即得到该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。 从LBP的定义可以看出,LBP算子是灰度不变的,但却不是旋转不变的。图像的旋转就会得到不同的LBP值。 Maenpaa等人又将LBP算子进行了扩展,提出了具有旋转不变性的LBP算子,即不断旋转圆形邻域得到一系列初始定义的LBP值,取其最小值作为该邻域的LBP值。 基本的LBP算子的最大缺陷在于它只覆盖了一个固定半径范围内的小区域,这显然不能满足不同尺寸和频率纹理的需要。 2)圆形LBP算子: 为了适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求,Ojala等对LBP算子进行了改进,将3×3邻域扩展到任意邻域,并用圆形邻域代替了正方形邻域,改进后的LBP算子允

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档