网站大量收购独家精品文档,联系QQ:2885784924

编码理论 第二版 教学课件 作者 田丽华 第12 16章 第15章.ppt

编码理论 第二版 教学课件 作者 田丽华 第12 16章 第15章.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
15.1 现代信源编码技术 15.1.1 分形编码(fractal coding)   自然界是由许许多多复杂形状、图形结构而构成,归纳起来它的形状和各种图形可分为两类:一类是有特征长度的图形,可用欧几里德几何学来描述和构造,例如房屋、汽车、足球、人等等,它们都是由具有特征长度的图形而构造的,象房屋的高宽,汽车的长度,足球的直径,人的身高等都是特征长度。另一类是没有特征长度的图形,例如海岸线、云彩、蛋糕的空穴等等,如果没有人工参照物,很难测量其尺度。这些无规则的复杂现象和物体如何去构造它们,这个问题直到20世纪70年代才得以解决。   1975年波兰出生的美国数学家曼德尔布诺特(Mandelbrot B B)首先研究了这种不规则形状和过程的性质,建立了自然界的分形几何理论。分形就是那些没有特征长度的图形的总称。Mandelbrot认为分形是几何外形,它与欧几里德几何外形相反,是没有规则的;首先它们处处无规则可言,其次它们在各种尺度上都有同样的不规则性。即分形几何研究的对象是无规则的图形,且这种无规则图形从整体到局部变化,虽然均属无规则性,但具有自相似性(Self-similarity)。换言之,无论几何尺度怎样变化,事物任何一小部分的形状都与较大部分的形状极其相似。这种尺度不变性(Scale—invariance)在自然界中广泛存在。分形中最显著特点是自相似性,如弯弯曲曲的海岸线,洁白无瑕的晶状雪花,变换无穷的云彩,蕨类植物的叶子,排列成格状的峰窝等,它们都是自相似性的典型例子。    分形图之美丽,分形几何学之奇妙就在于它的自相似性,而从编码的角度,正是要恰当地、最大限度地利用这种自相似性。分形方法可以用于压缩编码原因之一就是分形的自相似性。   分形信源编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展,是研究不规则图形和混沌运动的一门新科学,它描述了自然界物体的自相似性,这种自相似性可以是确定的,也可以是统计意义上的。M.Barnsley引入了迭代函数系统(IFS,Iterated Function System)来刻划这种自相似性,并将其用于信源编码,对某些特定图像获得了10000 :1的压缩比。M.Barnsley的方法需要在人工干预下进行,为此他的学生Jacquin提出了基于迭代压缩变换(ICT,Iterated Compression Transform)的自动分形图像编码方法,将分形在图像编码上的应用推进了一大步。 15.1.2 模型编码   基于模型的信源编码技术是近几年发展起来的一种很有前途的低比特率编码方法。它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型。基于模型的编码器并不压缩实际的量化数据,而是采用一个表示景物(一般是人、人脸等)的模型,传送的信息是告诉接收方如何改变模型以匹配输入景物(如眨眼、扭头等)。基于模型的解码器也有一个与对应编码器相同的模型,解码器利用收到的数据调整其模型,然后生成供显示的图像。模型编码根据输入的图像提取模型参数,并根据模型参数重建图像。显然,模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。   从信息抽取功能的角度看,已经提出的模型包括:图像模型——回答目标图像如何被模型化才会有效的问题;视觉模型——描述重建图像后,人类视觉系统感知误差的形式和能力。这两种模型中,前者是模型法主要研究的对象,后者则偏重于在编码过程中引入人的视觉特性以便得到更好图像质量的研究。从建立图像模型的复杂度和灵活性等角度考虑,三维线框模型(即用很多三角曲面片来逼近目标图像)是最好的,其他模型则因计算复杂和缺乏灵活性而很少使用。为了对图像数据建模,一般要求对输入图像要有某些先验知识。目前研究最多、进展最快的是针对可视电话应用中的图像序列编码,这类应用中的图像大多为人的头肩像。实质上此时的编码器是一个特征检测器,译码器是一个三维显示程序。基于模型的图像编码方法利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。在模型编码方法的研究中还存在很多问题。例如:   (1)模型法需要先验知识,不适合于一般的应用;   (2)对不同应用所建模型是不一样的;   (3)在线框模型中,控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取;   (4)即使对头肩模型,也存在很多问题,例如由特定人模型推广到非特定人、模型参数的快速抽取、表情运动参数的计算等都没有很令人满意的解决方法,大部分系统还依赖于FACS(FacialActionCodingSystem)中对表情块AU(ActionUnit)的描述,需要专用交互式系统,运算

您可能关注的文档

文档评论(0)

118压缩包课件库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档