- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
局部二进制模式资料
局部二进制模式 基本LBP及圆形邻域的LBPP,R算子 王聪唐加沁 简介 局部二进制模式(LBP)是一种有效的纹理描述算子,它具有旋转不变性和灰度不变性等显著的优点,是一种非常经典的用来描述图像局部纹理特征的算法。 它首先由T. Ojala, M.Pietik?inen, 和D. Harwood 在1994年提出,用于辅助性的度量图像的局部对比度。自从提出之后,LBP就作为一个有效的纹理特征提取方法,它不断的被人使用和改进,并广泛应用于纹理分类、人脸识别等领域。 算法简介 最初的LBP算子定义为3x3的窗口,以窗口中心像素为阈值,将相邻的8个像素的灰 度值与其进行比较,若周围像素值大于中心点的值,则该像素位置被标记为1,否则为0。这样,3x3邻域内的8个点可产生一个8-bit的无符号数,再按其位置赋以不同权重求和得一个整数,即为该点的LBP值。 例如:对于一个确定的窗口邻域,在计算中心像素的LBP值之前,应先确定该像素邻域范围内像素对应的阈值。阈值的确定规则为:若邻域中某一像素的值不小于中心像素值,则将该像素对应的阈值置为1,否则为0。而后邻域窗口内的灰度值作为对应阈值的权重计算邻域内阈值的加权和,求得的加权和作为中心像素的值来描述纹理特征。 例 对图一中的3x3区域的中心点,以其灰度值88作为阀值,对其8邻域进行二值化,并从左上点按顺时针方向(具体顺序可任意,只要统一即可)将二值化结果组成一个二进制即十进制的139,作为中心点的响应。即这一点的LBP值为139。就这样对整个图像进行LBP运算,就可以得到这幅图像的LBP特征。 → 图一 图二 但是得到这些特征有什么作用呢?提取图像特征的目标无非就是为了进行分类,我们把一幅灰度图像转化为了LBP特征图像,从理论上讲并没有实现降维,也无法进行分类。 这时就引入了直方图统计,我们将LBP特征进行直方图统计,也就是统计LBP特征0~255各占的比例,这样就进行了数据的降维。之后就可以将一个向量输入分类器中进行分类。 图三 圆形邻域的LBPP,R算子 基本LBP特征是根据相邻的像素点与中间相邻点相比的大小确定置为1或0,然后对每个像素点的领域信息进行整合,变为领域个位的数的编码。然后对一个块中所有像素的编码进行直方图的统计,得到LBP特征。 圆形邻域的LBPP,R算子 在基本LBP算子的基础上,T. Ojala等人在研究中利用圆形邻域(P,R)替代3x3的8邻域窗口,对上述基本的LBP进行扩展,这里P为邻域内像素的个数,R指邻域的半径,见图二。这样对P和R设置不同的数值,并结合插值技术,使得邻域中像素的个数可以为任意感兴趣的数值,这种情况下得到的LBP算子可以用来描述不同尺度的纹理结构。鉴于这种情况,结合结构性纹理分析的思想可以看出,这种扩展的LBP算子具有表征多种纹理结构的能力。图二显示了几种不同(P,R)值对应的邻域。 图四 圆形LBP特征就是在每一个像素点周围用圆形区域进行编码采样,其余和基本LBP特征相同。 这里有一个问题,假如你在圆上采样,那必然会导致部分计算出来的采样点的坐标不是整数。而在图像中,每个像素点的坐标都必须是整数。 如右图所示:若设领域半径R = 1,且采样 的8个像素点等间隔的分布在这个圆上。因 为红色标出的点为要计算编码的像素点, 因此它的坐标为整数(x,y)。那么绿色标出 的点的坐标必定不是整数,因此也无法从图 像上得到这个点的像素值。 图五 图四给出了一个半径为2的8领域像素的圆形领域,图中每个方格对应一个像素,对于正好处于方格中心的领域点(左、上、右、下四个黑点),直接以该点所在方格的像素值作为它的值;对于不在像素中心位置的领域点(斜45方向的4个黑点),当然简单的方法可以用最近的一个点的值进行代替,但更好的方法是进行双线性插值确定其值。 图六 在图像纹理分析中,纹理被认为是图像中特定的局部邻域结构规律性分布的重复出现。通过计算得到的LBPP,R满足0≤LBPP,R≤2^p-1。例如,窗口大小为(P=8, R=1)时,LBPP,R的计算值介于0至255之间。也即是说,采用这种方法,在窗口大小为(P=8, R=1)时,可以捕捉256种不同的特征码。在特征码与纹理模式对应的前提下,能够提取到256种不同纹理基元。纹理基元种类的丰富性增加了这种算子对纹理的描述能力,使得利用这种方法进行的图像纹理分析能够精确细致地进行特征提取。 LBP已经成功应用于人脸检测,唇语识别,表情检测,动态纹理等等领域。其算法复杂度低,消耗内存小,原理简单,但并不一定适合所有的特征描述。 谢谢!
文档评论(0)