- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音频压缩编码技术
音频压缩编码技术 信息学院 电子二班 本内容参照清华大学出版社许志祥编著的 《数字电视与图像通信技术》2009年8月第1版。 先讲声音编码机器压缩依据,分析人的听觉生 理-心理特性,再简单介绍数字音频信号压缩编 码的主要类型,最后重点介绍MPEG-1音频压缩 编码标准。 一、概述 二、人的听觉生理—心理特性 三、数字音频信号压缩编码的主要类型 四、MPEG-1音频压缩编码标准 一、概述 1、声音(Audio) 声音的传送是通信中一个极为重要的内容。电视及图像通信中除了传送图像外,传送声音也是极为重要的,如在会议电视中,由于通信线路带宽的限制,图像是可以跳帧的,每秒钟能传送10帧已经很不错了,但语音的传送却不可以断续,而且要有较高音质。 2、声音编码(Audio Coding) 声音编码(Audio Coding)是一类高保真的音频编码,它的带宽应为20Hz~20kHz ,但在许多场合,主要是传送语音而不是音乐音频带宽在50Hz~7kHz就够了。在声音编码中主要传送语音的一类编码称之为语音编码(speech coding)。数字声音信号与图像信号一样,通过取样、量化、编码后的数据量也非常大,传输与存储均有很大困难。 3、压缩依据 声音信息能够进行压缩的基本依据是声音信息 的冗余度及人类的听觉特性。 从信息保持的角度讲,只有当信源本身具冗余 度,才能进行压缩。因为语音和音乐信号中存在着 时域信息冗余及频域信息冗余,所以可以进行压缩 ,这是对音频信号进行压缩的一个理论基础。 语音和音乐信号最终是传送给人听的,人的听觉 生理—心理特性在整个音频传输过程中起着重 要的作用。由于人们的听觉系统存在着某些不敏感效 应,某些情况下的音频不能被感知,因此从感知效果 来看这些不敏感的音频分量可认为是知觉冗余。如果 将这部分冗余压缩掉,可提高编码效率,这是音频压 缩的另一个理论基础。 4、对音频数据压缩的两个途径 (1)利用信号本身的统计特性,在完全不丢失 信息的情况下进行高效的熵编码(平均信息量编码) (2)利用人们对音频信号的感知特性,通过省 略人们所不能分辨或不敏感的信息来压缩信息量,这 就是知觉编码。 二、人的听觉生理—心理特性 听觉的掩蔽效应是声音编码的基础,掩蔽 效应既和频率与有关,也和时间域有关。 1、频谱掩蔽效应 若有一个声压强度达70db、频率1kHz的纯音 出现时,处于1kHz邻近某一频带内强度较小的 信号声音信号人耳是听不见的,即被1kHz纯音 掩蔽掉了。 2、时间掩蔽效应 除了在较强的声音信号出现时,弱信号会 被屏蔽掉外,在强的声音信号出现之前或之后 的短暂时间内已存在的弱因信号也会被强信号 屏蔽掉,分别称为前掩蔽和后掩蔽,这种情况 叫做时间掩蔽效应(Temporal Masking Effect)。 3、方向掩蔽效应 人耳除具有听觉掩蔽效应外,还不能分别 判断频率接近的高频声音信号的方向,在声音 编码中可利用此特性,把高频声道的多个部分 耦合到一个公共声道,已达到压缩编码的目的 。 三、数字音频信号压缩编码的主 要类型 数字音频信号的压缩编码主要分为熵编码 、波形编码、参数编码和混合编码四种类型。 1、熵编码 主要包括霍夫曼编码、算术编码与游程编码。 2、波形编码 主要包括全频带编码子带编码和矢量量编 码,波形编码能够在高码率的条件下获得高质 量的音频信号,因而适用于高保真语音及音乐 信号的压缩编码。 3、参数编码 指使用合适的模型参数与参考激励信号来 模拟音频信号进行编码,当声音重放时,根据 这些参数重建音频信号,这就是通常所说的声 码器(Vocoder)。参数编码压缩比很高,计算 量也很大,因而不适合高保真要求的应用场合。 4、混合编码 混合编码充分吸收了波形编码与参数编码的 优点,并将二者结合,它包括多脉冲线性预测 编码(MPL-PC)、矢量和激励线性预测编码 (VSELP)、码激励线性预测编码(CELP)等。 四、MPEG-1音频压缩编码标准 1﹑ MPEG-1音频的三个层次 MPEG-1(ISO/IEC11172)标准的第三部分 (ISO/ IEC11172-3)称为MPEG-1音频。 MPEG-1音频部分提供单声道(mono)与双 声道 (stereo)数字音频,取样频率为32kHz ﹑44.1kHz和48kHz。音频的压缩编码技术采用 的是MUSICAM方案。 MPEG-1音频按照压缩编码的复杂程度规定 了3个层次,即Layer1﹑Layer2﹑Layer3三个层 次的基本模型是相同的
您可能关注的文档
最近下载
- 作物育种学(总论).ppt
- 2024重庆市公安局万盛经开区分局辅警岗位招聘20人笔试备考试题及答案解析.docx VIP
- 2025年高中历史(2022版)课程标准考试测试卷及答案(共5套).docx VIP
- 2025事业单位考试时事政治知识试题库(附含参考答案).docx VIP
- 水质理化检验.docx VIP
- 2025年劳动关系协调师职业技能竞赛考试题库资料500题(含答案).pdf VIP
- 工程安全保证体系.doc VIP
- 第6章非线性光学20131211.ppt VIP
- 2025福建福州首邑产业投资集团有限公司(第一次)招聘18人笔试备考试题及答案解析.docx VIP
- 彩礼合同协议书.docx VIP
文档评论(0)