第9章_MPEG音频学案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体原理与系统设计 中南大学信息科学与工程学院 黄东军 第九章 MPEG音频 1 听觉系统的感知特性 1.1 对响度的感知 1 听觉系统的感知特性 1.1 对响度的感知 观察结论: 存在听阈和听觉盲区 存在痛阈 听觉系统对2kHz~4KHz的声音最敏感 1 听觉系统的感知特性 1.2 对音高的感知 观察结论: 听觉系统对频率的感知与声音的客观频率成非线性关系。 Mel = 1000 log 2 (f + 1) 1 听觉系统的感知特性 1.3 掩蔽效应 当一个强纯音和一个弱纯音的频率接近时,听觉系统就会失去对弱纯音的感知,这种现象称为掩蔽效应。 1 听觉系统的感知特性 1.3 掩蔽效应 观察结论: 低频音较之高频音有更强的掩蔽作用。 存在若干个(通常为24个)所谓掩蔽效应带(频率区间),称为临界频带(critical band)。 2 MPEG Audio的心理声学模型 由于存在听觉阈值,因此当输入信号的电平地低于听觉阈值时,系统就去掉这些信号,从而减少了音频数据量。 由于存在掩蔽效应,因此系统可以设法消除被掩蔽的声音信号(电平),这也降低了数据量。 由于听觉系统对2kHz~4KHz的声音比较敏感,因此系统可以提高对这一部分信号的编码强度,而降低其他频段信号的编码强度。 3 MPEG Audio编解码系统 3.1 系统结构 MPEG Audio Codec = Sub-Band Codec + 心理声学模型 3 MPEG Audio编解码系统 3.2 部件分析 多相滤波器组 作用:将输入信号分成32个频率子带。 子带划分方法:线性划分;按临界频带划分 3 MPEG Audio编解码系统 3.2 部件分析 编码器 3 MPEG Audio编解码系统 3.2 部件分析 心理声学模型 3 MPEG Audio编解码系统 3.2 部件分析 心理声学模型如何作用于编码器 核心思想:计算所谓信掩比(Signal-to-Mask Ratio, SMR),通过SMR来调节量化深度。 SMR = 掩蔽阈值(最小) 掩蔽音 例如: 掩蔽阈值 SMR 被掩蔽音(noise) 降低量化深度 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层 层1 - 每帧数据包含384个样本(32 x 12) - 采用线性子带划分 - 使用频域掩蔽特性 - SMR使用全局掩蔽阈值 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层 层2 - 每帧数据包含1152个样本(32 x 12 x 3) - 采用线性子带划分 - 使用频域掩蔽和时域掩蔽特性 - SMR使用全局掩蔽阈值 3 MPEG Audio编解码系统 3.3 MPEG Audio 的编码分层 层3(即MP3) - 每帧数据包含1152个样本(32 x 12 x 3) - 采用临界频带划分子带 - 使用频域掩蔽和时域掩蔽特性,还考虑了立体声冗余特性 - 增加使用Huffman编码进一步压缩数据 Thank you !

文档评论(0)

ccx55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档