第9章_MPEG音频学案.ppt

下载文档 降价啦

2
0
约1.43千字
约 18页
2016-11-26 发布于湖北
举报
版权申诉
保障服务

第9章_MPEG音频学案.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

多媒体原理与系统设计中南大学信息科学与工程学院黄东军第九章 MPEG音频 1 听觉系统的感知特性 1.1 对响度的感知 1 听觉系统的感知特性 1.1 对响度的感知观察结论：存在听阈和听觉盲区存在痛阈听觉系统对2kHz~4KHz的声音最敏感 1 听觉系统的感知特性 1.2 对音高的感知观察结论：听觉系统对频率的感知与声音的客观频率成非线性关系。 Mel = 1000 log 2 (f + 1) 1 听觉系统的感知特性 1.3 掩蔽效应当一个强纯音和一个弱纯音的频率接近时，听觉系统就会失去对弱纯音的感知，这种现象称为掩蔽效应。 1 听觉系统的感知特性 1.3 掩蔽效应观察结论：低频音较之高频音有更强的掩蔽作用。存在若干个（通常为24个）所谓掩蔽效应带（频率区间），称为临界频带（critical band）。 2 MPEG Audio的心理声学模型由于存在听觉阈值，因此当输入信号的电平地低于听觉阈值时，系统就去掉这些信号，从而减少了音频数据量。由于存在掩蔽效应，因此系统可以设法消除被掩蔽的声音信号（电平），这也降低了数据量。由于听觉系统对2kHz~4KHz的声音比较敏感，因此系统可以提高对这一部分信号的编码强度，而降低其他频段信号的编码强度。 3 MPEG Audio编解码系统 3.1 系统结构 MPEG Audio Codec = Sub-Band Codec + 心理声学模型 3 MPEG Audio编解码系统 3.2 部件分析多相滤波器组作用：将输入信号分成32个频率子带。子带划分方法：线性划分；按临界频带划分 3 MPEG Audio编解码系统 3.2 部件分析编码器 3 MPEG Audio编解码系统 3.2 部件分析心理声学模型 3 MPEG Audio编解码系统 3.2 部件分析心理声学模型如何作用于编码器核心思想：计算所谓信掩比（Signal-to-Mask Ratio, SMR），通过SMR来调节量化深度。 SMR = 掩蔽阈值（最小）掩蔽音例如：掩蔽阈值 SMR 被掩蔽音（noise）降低量化深度 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层层1 - 每帧数据包含384个样本（32 x 12） - 采用线性子带划分 - 使用频域掩蔽特性 - SMR使用全局掩蔽阈值 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层层2 - 每帧数据包含1152个样本（32 x 12 x 3） - 采用线性子带划分 - 使用频域掩蔽和时域掩蔽特性 - SMR使用全局掩蔽阈值 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层层3（即MP3） - 每帧数据包含1152个样本（32 x 12 x 3） - 采用临界频带划分子带 - 使用频域掩蔽和时域掩蔽特性，还考虑了立体声冗余特性 - 增加使用Huffman编码进一步压缩数据 Thank you !