第六讲 无损数据压缩.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六讲 无损数据压缩

多媒体数据最终都是用0和1来表示。表示的方法不同,文件大小也会不同。小相对于大就是压缩。具体的表示方法就是压缩算法或压缩编码。 多媒体数据压缩的可能性: 信息冗余 采集的多媒体数据信息具有相关性,可以用数学的方法来表示这些重复数据或相关数据。 感官误差允许 人们在感知各种媒体对象时,往往对一些细节信息没有很强的感知,而且存在各种隐蔽效应。 信源被抽象为一个变量。 如果信源输出的随机变量取值于某一连续区间,就叫做连续信源。 如果信源输出的随机变量取值于某一离散符号集合,就叫做离散信源。比如数字图像I(x,y)和数字语音。 压缩编码属于信源编码。 二、信息量和信息熵 香农信息论把一个事件(字符)所携带的信息量定义为: The Father of Information Theory ——Claude Shannon Born: 30 April 1916 in Gaylord, Michigan, USA Died: 24 Feb 2001 in Medford, Massachusetts, USA 信源的熵的定义为 第3节 熵编码 熵编码的宗旨在于找到一种编码使得平均码长到达熵极限,基本思想就是对出现概率较大的符号取较短的码长,而对出现概率较小的符号取较大的码长。 包括: 香农-范诺编码 霍夫曼编码 算术编码 二、霍夫曼编码 1952年问世,依据变字长编码理论 步骤: (1)初始化 (2)合并概率最小的两个事件 (3)排序 (4)如果事件个数大于2则重复(2)和(3) (5)赋值 (6)编码 例:设符号{a1,a2,a3,a4,a5,a6}出现的概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算编码效率、压缩比。 霍夫曼编码(香农-范诺编码)的特点: 霍夫曼编码是变长码,唯一可译码(没有二译性),不需要附加同步码。 霍夫曼编码是及时码。 解码过程需要码表,对霍夫曼编码称为霍夫曼码簿。 霍夫曼编码将输入最终编码为二进制数输出。 没有错误保护机制,若一位发生错误,后面可能全错。 事先若不能得知概率分布则无法编码。 三、算术编码 基本思想:算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率,再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。 消息序列中的每个元素都要用来缩短这个区间。消息序列中元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间。 算术编码比霍夫曼编码有更好的压缩率。 算术编码举例(一) 算术编码举例(二) 算术编码的具体实现 因为实际只能用有限长的寄存器,所以在编码时要进行合适的比例缩放。 算术编码每次递推都要做乘法,所以效率比较低。二进制算术编码是一种实用的编码算法,用移位代替了乘法,使效率大大提高。 但是事件的概率未必是0.5的整数次方,怎么办? 自适应算术编码可以在编码过程中根据符号出现的频繁程度动态的修改分布概率,这样可以避免在编码之前必须精确求出信源概率。 第4节 行程编码(RLE) 行程编码(Run-Length Encoding):它通过将信源中相同符号序列转换成一个计数字段再加上一个重复字符标志实现压缩。 例如:RTTTTTTTTABBBBDD被转换为: 1R8T1A4B2D 或R#8T#A#4B#2D,其中“#”作为转义字符,表明其后所跟的字符表示长度。 行程编码多用于黑白二值图像的压缩中。例如00000000111111111111000001111111被转化为一系列黑串和白串长度的编码:8,12,5,7。 因为串长度并非等概率分布,行程编码一般要配合统计编码(Huffman编码)。 第5节 词典编码 词典编码主要利用数据本身包含许多重复的字符串的特性。我们如果用一些简单的代号代替这些字符串,就可以实现压缩,字符串与代号的对应表就是词典。 实用的词典编码算法的核心就是如何动态地形成词典,以及如何选择输出格式以减小冗余。 一、第一类词典编码 第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。 LZ77编码 原理:尽量在以编码的字符中寻找和待编码一样的字符或字符串,如果找到,只要指出在以前

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档