- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于图割的快速的近似能量最小化汇编
使用图割的快速近似能量最小化
姓名:梁瑷云
时间:2016.5.17
目录
摘要
早期视觉的能量最小化
相关工作
算法综述
寻找最优交换移动(算法)
寻找最佳扩展移动(算法)
?最优性能
POTTS?模型
实验结果
结论
摘要
作者提出两种基于图割的算法:α-expansion 和α-β-swap 移动算法,可以同时改变标签任意大的像素集。目的:找到一个有效的局部最小值,已达到找全局最小值的目的。能处理更一般的能量函数。主要用于图像恢复、立体声、运动方面。精确度能达到98%。
早期视觉的能量最小化
许多早期视觉领域,通常需要估计一些空间(像素平面)上变化的量(如图像灰度、视差大小)。这些量在块的内部变化平滑,在块与块之间(物体边界)变化很大,像素点p ∈P被分配给有限集合fp ∈ L。将每个像素映射到标签集中的某个标签上,这里标签函数(映射)?f?不仅需要满足分块平滑的特点而且需要和观测到的数据一致。?
能量函数:
E(f)=Esmooth(f)+Edata(f)
在能量函数的构造上一般有数据约束和平滑约束,体现了区域内部的连续性和边界的不连续性。Esmooth(f)?表达的是?f?分块不平滑的程度,Edata(f)?表达的是标签函数?f?与观测到数据的不一致性。Edata(f)?的一般形式是
Edata(f)=∑(p ∈P)Dp(fp)
Dp 来度量标签与观测数据的一致性,在图像恢复 Dp(fp)=(fp-Ip)2 ,Ip表示在像素点?p?处的灰度值 。( Edata(f)在本文不作讨论)
能量最小化难点:计算花销大,很多能量函数有许多局部最小值(非凸),空间维度多。
本文考虑的能量函数为:
Esmooth=∑{p,q}∈NVp,q(fp,fq),
N:相邻像素对集合。Vp,q(fp,fq)?表示像素对?{p,q}?在标签函数?f?下生成的标签?(fp,fq)?之间的距离(相似度、平滑程度) Dp非负,其他任意。
该论文中提出了两种对任意有限大小的标签集?L?进行近似能量最小化的算法:α-expansion and?α-β-swap,分别针对两种互作用势(interaction penalty):度量(metric)、半度量(semi-metric)。在标签L的空间中V是否以下条件满足:
则V是一个度量。如果只满足(2)、(3)则为半度量。
需要注意的是不论是度量还是半度量互作用势,都包含重要的“非连续性保留”的互作用势。这个特性在后续证明中是会用到的,也说明了两种算法分别适用的情况
相关工作
之前的算法大多数是寻找局部最小值,存在低效率、收敛速度慢的问题
1.相对于能量函数来说,局部能量最小化的办法都有哪些?
标准移动:
1)迭代条件模式(ICM)对于每一个像素,标签赋予最大的减少能量函数的选择,直到收敛到局部最小值。
2)? 模拟退火:优:优化任意能量函数。缺:任意能量函数最小化需要指数时间和结果模拟退火速度非常慢。时间够长,能找到全局最小值。效率低。
3)平均场退火算法:
? 梯度下降法,通常仅能保证能量函数的局部最优,并且依赖于近似的数值计算模式( 如有限差分、有限元) ,需要对数值计算进行很好的设计以保证解的鲁棒性和收敛性
? 图割:通过提供代价函数( cost function) ,将区域、边界及一些拓扑限制很自然地融入到代价函数中,能够实现能量的全局最优化。
算法综述
1、分割和移动空间
每一个标签映射函数?fp∈L?与图像分割方式是一一对应的关系,而?fp(后简写为?f) 是能量函数的自变量,因此我们可以称所有可能的?f?的取值所组成的集合为操作空间或移动空间.
用数学描述如下:?任意一种标签方式?f?都能通过像素的一个分割来表示:?P={Pl|l∈L},?其中?Pl?表示标签为?l的像素点集合。可以看到标签方式?f?与分割?P?成一一对应关系。?
如图2:
每一次标签调整,也就是 f 在操作空间中的每一次移动遵循一定规定的我们称之为交换(swap)和扩张(expansion)操作,swap 和 expansion 操作的具体意义:
swap: 给定一对标签 α,β,从一个分割 P 到另一个分割 P′ 的移动(变动)在满足以下条件时称之为一次 α-β swap 标签调整操作:对任意 l≠α,β 都有 Pl=Pl’ 。也就是说在一次 α-β-swap 调整操作后,一些原来是 α 标签的像素被标记为 β,一些原来是 β 标签的被标记为 α,简而言之就是被标记为 α,β 标签的像素集合之间进行了交换。(图2c)
- expansion: 给定一个标签
文档评论(0)