第四章算术编码.pptVIP

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章算术编码

第四章:算术编码 算术编码:越来越流行(在很多标准中被采用) 适合的场合: 小字母表:如二进制信源 概率分布不均衡 建模与编码分开 内容: 算术编码的基本思想 一些性质 实现 有限精度:区间缩放(浮点数/整数实现) 计算复杂度:用移位代替乘法?二进制编码 自适应模型 QM编码器:自适应二进制编码 回顾: Huffman编码 例1:信源的符号数目很少 回顾:扩展的Huffman编码 例2:信源的符号的概率严重不对称: A = {a, b, c}, P(a) = 0.95, P(b) = 0.02, P(c) = 0.03 H = 0.335 bits/symbol Huffman编码: a 0 b 11 c 10 l = 1.05 bits/symbol 冗余(Redundancy) = l - H = 0.715 bits/sym (213%!) 问题:能做得更好吗? 回顾:扩展的Huffman编码 基本思想: 考虑对两个字母序列而不是单个字母编码 回顾:扩展的Huffman编码 该思想还可以继续扩展 考虑长度为n的所有可能的mn 序列 (已做了32) 理论上:考虑更长的序列能提高编码性能 实际上: 字母表的指数增长将使得这不现实 例如:对长度为3的ASCII序列:2563 = 224 = 16M 需要对长度为n的所有序列产生码本 很多序列的概率可能为0 分布严重不对称是真正的大问题: A = {a, b, c}, P(a) = 0.95, P(b) = 0.02, P(c) = 0.03 H = 0.335 bits/symbol l1 = 1.05, l2 = 0.611, … 当n = 8时编码性能才变得可接受 但此时|alphabet| = 38 = 6561 !!! 算术编码(Arithmetic Coding) 算术编码:从另一种角度对很长的信源符号序列进行有效编码 对整个序列信源符号串产生一个唯一的标识( tag ) 直接对序列进行编码(不是码字的串联):非分组码 不用对该长度所有可能的序列编码 标识是[0,1)之间的一个数(二进制小数,可作为序列的二进制编码) 概率复习 随机变量: 将试验的输出映射到实数 用数字代替符号 X(ai) = i, 其中 ai ? A (A = {ai}, i = 1..n) 给定信源的概率模型P 概率密度函数(probability density function, pdf) 累积密度函数(cumulative density function, cdf) 产生标识 定义一一映射: ak ? [FX(k-1), FX(k)], k = 1..m, FX(0) = 0 [FX(k-1), FX(k)]区间内的任何数字表示 ak 对2字母序列ak aj编码 对ak ,选择[FX(k-1), FX(k)] 然后将该区间按比例分割并选取第j个区间: 产生标识:例 考虑对a1a2a3编码: A = {a1, a2, a3}, P = {0.7, 0.1, 0.2) 映射:a1 ? 1, a2 ? 2, a3? 3 cdf: FX(1) = 0.7, FX(2) = 0.8, FX(3) = 1 .0 映射成实数 A = {a1, a2, …, am} 词典顺序( Lexicographic order ) 字符串的词典顺序: 其中 表示“在字母顺序中,y在x的前面” n 为序列的长度 词典顺序:例 考虑两轮连续的骰子: 输出 = {11, 12, …, 16, 21, 22, …, 26, …, 61, 62, …, 66} 区间构造 观察 包含某个标识的区间与所有其他标识的区间不相交 基本思想 递归:将序列的下/上界视为更短序列的界的函数 上述骰子的例子: 考虑序列:3 2 2 令u(n), l(n) 为长度为n序列的上界和下界,则 u(1) = FX(3), l(1) = FX(2) u(2) = FX(2)(32), l(2) = FX(2)(31) 区间构造 区间构造 产生标识 通常,对任意序列x = x1x2…xn 产生标识:例 考虑随机变量X(ai) = i 对序列1 3 2 1编码: 解码标识 Algorithm Initialize l(0) = 0, u(0) = 1. For each i, i = 1..n Compute t*=(tag-l(k-1))/(u(k-1)-l(k-1)). Find the xk: FX(xk-1) ? t* ? FX(xk). Update u(n), l(n) If done--exit, otherwise goto 1. 解码:例 算术编码的唯一性和效率 上

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档