第2章_音频处理技术汇总.ppt

下载文档 降价啦

17
0
约2.11万字
约 127页
2017-07-04 发布于湖北
举报
版权申诉
保障服务

第2章_音频处理技术汇总.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* * (2)信息冗余多媒体数据中大的数据量并不完全等于它们所携带的信息量。在信息论中，称为冗余。冗余是指信息存在的各种性质的多余度. 减少数据冗余可以节省存储空间，有效利用网络带宽。 * 数据冗余的类型（1）空间冗余（2）时间冗余（3）信息熵冗余（4）视觉冗余（5）听觉冗余（6）知识冗余 * (3)压缩算法的分类 1）从信息量有无损失划分，有可逆编码和不可逆编码 ①可逆编码也叫无失真编码、冗余度压缩、熵编码等。其原理是减少数据中的冗余度，而不损失任何信息。解压时可以完全恢复出原来的数据，亦称无损压缩。典型的无损压缩有Huffman编码、算术编码和行程编码等。可逆编码由于不会产生失真，因此在多媒体技术中常用于文本、数据的压缩，它能保证完全地恢复原始数据。但这种方法的压缩比较低，一般在2:1～5:1之间。 * ②不可逆编码是有失真压缩，信息论中叫熵压缩。由于压缩了熵，会减少信息而不能再恢复。因此这种压缩又称有损压缩。在语音和图像中，由于存在视觉冗余和听觉冗余，减少这种信息并不影响人们的听觉效果和视觉效果，所以经常采用这种方法，有损压缩常用于数字化存储的模拟数据，并且主要应用于图像、声音、动态视频等数据的压缩。如果用混合编码的JPEG标准，对自然景物的彩色图像，压缩比可达到几十倍甚至上百倍。 * 2）根据压缩原理划分有预测编码、变换编码、矢量编码、子带编码、熵编码等。 ①预测编码对于语音，就是通过预测去除语音信号时间上的相关性。而对于图像，帧内预测去除了空间上的冗余，帧间预测则可以去除时间上冗余。目前大多数语音、图像编码中都采用了预测技术。例如语音中的LPC(linear Predictive Coding，线性预测)、CELP(码激励线性预测)、图像中的ADPCM(自适应差分脉冲编码调制)等。 * ②变换编码变换编码首先把要压缩的数据变换到某个变换域中，然后再进行编码。变换域中表现为能量集中在某些区域，就可以利用这一特点在不同区域间有效地分配量化比特数，或者去掉这些能量很小的区域，从而达到数据压缩的目的。例如声音中的频谱分析实际上是对语音波形进行了快速傅里叶变换（FFT），将时域信号变到了频域中，可以清楚地看到能量集中在哪些频率范围内。 * ③矢量量化矢量量化是利用相邻数据间的相关性，将数据序列分组进行量化的一种压缩方法。和预测编码一样，矢量量化本质也是利用数据序列的统计相关性进行压缩的。 ④子带编码子带编码首先让原始数据分别通过若干个具有不同通频带的滤波器，将信号分成多个子带信号输出，然后分别对各个滤波器的输出进行编码。当滤波器选取得合适时，它们的输出将各自具有不同的分布特性，对各频段进行不同的量化处理，可以有效地进行数据压缩。 * ⑤熵编码根据信息墒的原理，用短码表示出现概率大的数据，用长码表示出现概率小的数据。这是一种无损数据压缩技术，在语音和图像编码中常常和其它有损压缩编码方法结合使用。 ⑥分型编码分型的含义是某种结构的组成部分以某种方式与整体相似。分型编码把数字图像通过一些图像处理技术，将原始图像分成一些子图像。然后再分型集中查找这样的子图像。分型集实际上并不是存储所有可能的子图像，而是存储许多迭代函数，通过迭代函数反复迭代来恢复图像。 * 3）根据编码后产生的码字长度是否相等，数据编码又可分为定长码和变长码。 ①定长码采用相同的为数对数据进行编码。大多数存储数字信息的编码系统都采用定长码。 ②变长码采用不相同的为数对数据进行编码，以节省存储空间。 * 2.无损压缩编码方法无损压缩算法可以大致分为两大类：统计式压缩法和字典式压缩法。统计式压缩法先将要被编码的数据整体所采用的符号做一个统计，然后将重复性越大的符号重新以越短的码来表示，重复性低的符号重新以长的码来表示，结果使总的数据量减小。字典式压缩法是采用“字典”中用来识别某个字符串的码字去替换文本中这个字符串。 * (1)霍夫曼编码霍夫曼(Huffman)编码在1952年为文本文件而建立。霍夫曼编码的码长是变化的，对于出现频率高的信息，编码的长度较短；而对于出现频率低的信息，编码长度较长。这样，处理全部信息的总码长一定小于实际信息的符号长度。（1）将信号源的符号按照出现概率递减的顺序排列。（2）将两个最小出现概率进行合并相加，得到的结果作为新符号的出现概率。（3）重复进行步骤1和2，直到概率相加的结果等于1为止。（4）在合并运算时，概率大的符号用编码1表示，概率小的符