音频压缩编码技术.ppt

下载文档 降价啦

9
0
约 21页
2017-09-02 发布于湖北
举报
版权申诉
保障服务

音频压缩编码技术.ppt

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

音频压缩编码技术

音频压缩编码技术信息学院电子二班本内容参照清华大学出版社许志祥编著的《数字电视与图像通信技术》2009年8月第1版。先讲声音编码机器压缩依据，分析人的听觉生理-心理特性，再简单介绍数字音频信号压缩编码的主要类型，最后重点介绍MPEG-1音频压缩编码标准。一、概述二、人的听觉生理—心理特性三、数字音频信号压缩编码的主要类型四、MPEG-1音频压缩编码标准一、概述 1、声音（Audio）声音的传送是通信中一个极为重要的内容。电视及图像通信中除了传送图像外，传送声音也是极为重要的，如在会议电视中，由于通信线路带宽的限制，图像是可以跳帧的，每秒钟能传送10帧已经很不错了，但语音的传送却不可以断续，而且要有较高音质。 2、声音编码（Audio Coding）声音编码（Audio Coding）是一类高保真的音频编码，它的带宽应为20Hz~20kHz ，但在许多场合，主要是传送语音而不是音乐音频带宽在50Hz~7kHz就够了。在声音编码中主要传送语音的一类编码称之为语音编码（speech coding）。数字声音信号与图像信号一样，通过取样、量化、编码后的数据量也非常大，传输与存储均有很大困难。 3、压缩依据声音信息能够进行压缩的基本依据是声音信息的冗余度及人类的听觉特性。从信息保持的角度讲，只有当信源本身具冗余度，才能进行压缩。因为语音和音乐信号中存在着时域信息冗余及频域信息冗余，所以可以进行压缩，这是对音频信号进行压缩的一个理论基础。语音和音乐信号最终是传送给人听的，人的听觉生理—心理特性在整个音频传输过程中起着重要的作用。由于人们的听觉系统存在着某些不敏感效应，某些情况下的音频不能被感知，因此从感知效果来看这些不敏感的音频分量可认为是知觉冗余。如果将这部分冗余压缩掉，可提高编码效率，这是音频压缩的另一个理论基础。 4、对音频数据压缩的两个途径（1）利用信号本身的统计特性，在完全不丢失信息的情况下进行高效的熵编码（平均信息量编码）（2）利用人们对音频信号的感知特性，通过省略人们所不能分辨或不敏感的信息来压缩信息量，这就是知觉编码。二、人的听觉生理—心理特性听觉的掩蔽效应是声音编码的基础，掩蔽效应既和频率与有关，也和时间域有关。 1、频谱掩蔽效应若有一个声压强度达70db、频率1kHz的纯音出现时，处于1kHz邻近某一频带内强度较小的信号声音信号人耳是听不见的，即被1kHz纯音掩蔽掉了。 2、时间掩蔽效应除了在较强的声音信号出现时，弱信号会被屏蔽掉外，在强的声音信号出现之前或之后的短暂时间内已存在的弱因信号也会被强信号屏蔽掉，分别称为前掩蔽和后掩蔽，这种情况叫做时间掩蔽效应（Temporal Masking Effect）。 3、方向掩蔽效应人耳除具有听觉掩蔽效应外，还不能分别判断频率接近的高频声音信号的方向，在声音编码中可利用此特性，把高频声道的多个部分耦合到一个公共声道，已达到压缩编码的目的。三、数字音频信号压缩编码的主要类型数字音频信号的压缩编码主要分为熵编码、波形编码、参数编码和混合编码四种类型。 1、熵编码主要包括霍夫曼编码、算术编码与游程编码。 2、波形编码主要包括全频带编码子带编码和矢量量编码，波形编码能够在高码率的条件下获得高质量的音频信号，因而适用于高保真语音及音乐信号的压缩编码。 3、参数编码指使用合适的模型参数与参考激励信号来模拟音频信号进行编码，当声音重放时，根据这些参数重建音频信号，这就是通常所说的声码器（Vocoder）。参数编码压缩比很高，计算量也很大，因而不适合高保真要求的应用场合。 4、混合编码混合编码充分吸收了波形编码与参数编码的优点，并将二者结合，它包括多脉冲线性预测编码（MPL-PC）、矢量和激励线性预测编码（VSELP）、码激励线性预测编码（CELP）等。四、MPEG-1音频压缩编码标准 1﹑ MPEG-1音频的三个层次 MPEG-1(ISO/IEC11172)标准的第三部分（ISO/ IEC11172-3）称为MPEG-1音频。 MPEG-1音频部分提供单声道（mono）与双声道（stereo）数字音频，取样频率为32kHz ﹑44.1kHz和48kHz。音频的压缩编码技术采用的是MUSICAM方案。 MPEG-1音频按照压缩编码的复杂程度规定了3个层次，即Layer1﹑Layer2﹑Layer3三个层次的基本模型是相同的