第2章_音频处理技术汇总.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * (2)信息冗余 多媒体数据中大的数据量并不完全等于它们所携带的信息量。在信息论中,称为冗余。 冗余是指信息存在的各种性质的多余度. 减少数据冗余可以节省存储空间,有效利用网络带宽。 * 数据冗余的类型 (1)空间冗余 (2)时间冗余 (3)信息熵冗余 (4)视觉冗余 (5)听觉冗余 (6)知识冗余 * (3)压缩算法的分类 1)从信息量有无损失划分,有可逆编码和不可逆编码 ①可逆编码也叫无失真编码、冗余度压缩、熵编码等。其原理是减少数据中的冗余度,而不损失任何信息。解压时可以完全恢复出原来的数据,亦称无损压缩。典型的无损压缩有Huffman编码、算术编码和行程编码等。 可逆编码由于不会产生失真,因此在多媒体技术中常用于文本、数据的压缩,它能保证完全地恢复原始数据。但这种方法的压缩比较低,一般在2:1~5:1之间。 * ②不可逆编码是有失真压缩,信息论中叫熵压缩。由于压缩了熵,会减少信息而不能再恢复。因此这种压缩又称有损压缩。在语音和图像中,由于存在视觉冗余和听觉冗余,减少这种信息并不影响人们的听觉效果和视觉效果,所以经常采用这种方法, 有损压缩常用于数字化存储的模拟数据,并且主要应用于图像、声音、动态视频等数据的压缩。如果用混合编码的JPEG标准,对自然景物的彩色图像,压缩比可达到几十倍甚至上百倍。 * 2)根据压缩原理划分有预测编码、变换编码、矢量编码、子带编码、熵编码等。 ①预测编码 对于语音,就是通过预测去除语音信号时间上的相关性。而对于图像,帧内预测去除了空间上的冗余,帧间预测则可以去除时间上冗余。 目前大多数语音、图像编码中都采用了预测技术。 例如语音中的LPC(linear Predictive Coding,线性预测)、CELP(码激励线性预测)、图像中的ADPCM(自适应差分脉冲编码调制)等。 * ②变换编码 变换编码首先把要压缩的数据变换到某个变换域中,然后再进行编码。 变换域中表现为能量集中在某些区域,就可以利用这一特点在不同区域间有效地分配量化比特数,或者去掉这些能量很小的区域,从而达到数据压缩的目的。 例如声音中的频谱分析实际上是对语音波形进行了快速傅里叶变换(FFT),将时域信号变到了频域中,可以清楚地看到能量集中在哪些频率范围内。 * ③矢量量化 矢量量化是利用相邻数据间的相关性,将数据序列分组进行量化的一种压缩方法。和预测编码一样,矢量量化本质也是利用数据序列的统计相关性进行压缩的。 ④子带编码 子带编码首先让原始数据分别通过若干个具有不同通频带的滤波器,将信号分成多个子带信号输出,然后分别对各个滤波器的输出进行编码。当滤波器选取得合适时,它们的输出将各自具有不同的分布特性,对各频段进行不同的量化处理,可以有效地进行数据压缩。 * ⑤熵编码 根据信息墒的原理,用短码表示出现概率大的数据,用长码表示出现概率小的数据。这是一种无损数据压缩技术,在语音和图像编码中常常和其它有损压缩编码方法结合使用。 ⑥分型编码 分型的含义是某种结构的组成部分以某种方式与整体相似。 分型编码把数字图像通过一些图像处理技术,将原始图像分成一些子图像。然后再分型集中查找这样的子图像。 分型集实际上并不是存储所有可能的子图像,而是存储许多迭代函数,通过迭代函数反复迭代来恢复图像。 * 3)根据编码后产生的码字长度是否相等,数据编码又可分为定长码和变长码。 ①定长码 采用相同的为数对数据进行编码。大多数存储数字信息的编码系统都采用定长码。 ②变长码 采用不相同的为数对数据进行编码,以节省存储空间。 * 2.无损压缩编码方法 无损压缩算法可以大致分为两大类:统计式压缩法和字典式压缩法。 统计式压缩法先将要被编码的数据整体所采用的符号做一个统计,然后将重复性越大的符号重新以越短的码来表示,重复性低的符号重新以长的码来表示,结果使总的数据量减小。 字典式压缩法是采用“字典”中用来识别某个字符串的码字去替换文本中这个字符串。 * (1)霍夫曼编码 霍夫曼(Huffman)编码在1952年为文本文件而建立。霍夫曼编码的码长是变化的,对于出现频率高的信息,编码的长度较短;而对于出现频率低的信息,编码长度较长。这样,处理全部信息的总码长一定小于实际信息的符号长度。 (1)将信号源的符号按照出现概率递减的顺序排列。 (2)将两个最小出现概率进行合并相加,得到的结果作为新符号的出现概率。 (3)重复进行步骤1和2,直到概率相加的结果等于1为止。 (4)在合并运算时,概率大的符号用编码1表示,概率小的符

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档