第03讲 数据压缩技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第03讲 数据压缩技术

行程编码(RLE) RLE (run length encoding) 思想:数据项d在输入流中连续出现n次,则以单个字符对nd替换n次出现者。 将数据流中连续出现的字符用单一记号表示。 例如,字符串AAABCDDDDDDDDBBBBB 可以压缩为 3ABC8D5B 。 具有相同颜色并且是连续的像素数目称为行程长度。 表示方法:行程长度+数据 行程编码(RLE) 举例说明:假定一副灰度图像,第n行的像素值为如下图:111 888……888 11118个0 50个8 8个0 3个1 4个1 73位代码压缩表示为80315084180 压缩比为:73:11约为7:1 RLE编码优缺点 优点:直观,非常经济 缺点:有可能造成数据量增大 适用范围:重复度大的数据 思考:如何对数组数据进行RLE编码? 约定:只有不少于3个相同字符 连续出现时才用重复因子代替 RLE图像压缩 假设位图做为输入流,像素在位图中以扫面线方式排列。最左上角为第一个像素,右下角为最后一个像素 请给出下述位图的压缩文件(以0表示输出开始): 0,1,3,1,4,1,3,1,4,1,3,1,4, 1,3,1,3,2,2,2,6,1,1 RLE图像压缩 有一个8位灰度图像,表示如下: 编码方法: 若灰度图像为128级,则留1个标志位进行区别; 若灰度图像为256级,则将形成前加标记进行记录; 可分为每8个为一组,每组增加一个字节进行标记; 12,12,12,12,12,12,12,12, 12,35,76,112,67,87,87,87, 5,5,5,5,5,5,1,…… 使用RLE编码: 9 12 35 76 112 67 3 87 6 5 1…… 算术编码 算术编码的基本原理是:将编码的信息表示成实数0和1之间的一个间隔(interval),信息越长,编码间隔就越小,表示这一间隔所需的二进制位数就越长。 算术编码的主要步骤是: 首先把当前区间定义为[0,1]。 对输入流中的每个符号s,重复下面的两步: 把当前区间分割成长度正比于符号概率的子区间。 为s选择一个子区间,并将其定义为新的当前区间。 当用这种方法把整个输入流处理完成后,输出应为能唯一确定当前区间的任何数字(即位于当前区间中的任意数字) 算术编码 例:有3个符号A、B、C,概率分别是PA=0.4,PB=0.5,PC=0.1。求输入字符串BBBC的算术编码方法。 将[0,1]可以划分为[0,0.4],[0.4,0.9],[0.9,1]三个子区间, 看到输入流第一个字符B,将[0,1]区间缩小为[0.4,0.9]; 第二个字符仍为B,将[0.4,0.9]区间缩小为[0.6,0.85]; 第三个字符仍为B,区间被缩小为[0.7, 0.825]; 第五步:第四个字符为C,则区间被缩小为[0.8125, 0.8250]。 该方法所产生的最终码字可为该最终区间中的任意数字 算术编码 设high为编码间隔的高端,high=1; low为编码间隔的低端,low=0; range为编码间隔的长度,range=high-low; rangelow为编码字符分配的间隔低端;rangehigh为编码字符分配的间隔高端。 可得出: low=low+range×rangelow ; high=low+range×rangehigh 算术编码的解码过程 解码过程中,根据编码,依次判断输入字符。 此过程中,为从码字虫消除符号X的影响,解码器执行codenew=(code(X)-rangelow(X))/range的操作 例:对代码0.8125,在B的范围内,即第一个字符为B; codenew=(0.8125-0.4)/0.5=0.825——B codenew=(0.825-0.4)/0.5=0.85——B codenew=(0.85-0.4)/0.5=0.9——C Low High range A 0 0.4 0.4 B 0.4 0.9 0.5 C 0.9 1 0.1 Part 1 Part 2 第03讲——多媒体数据压缩技术 多媒体数据压缩技术 有损压缩 脉冲编码调制(PCM) 预测编码 变换编码 数据压缩的常用编码方法 脉冲编码调制(PCM) Pulse Code Modulation 概念上最简单、理论上最完善 最早研制,使用最广泛 数据量最大 脉冲编码调制(PCM) 采样过程 PCM的量化方式 均匀量化与非均匀量化 非均匀量化 对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。 非均匀量化也是一种压缩。 为什么说非均匀量化对话音质量有提高? 对大信号而言,绝对量化误差较

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档