14章MPEG声音压缩.pptVIP

下载本文档

9
0
约8.1千字
约 56页
2017-03-25 发布于上海
举报
版权申诉

14章MPEG声音压缩.ppt

1、本文档共56页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

14章MPEG声音压缩

MPEG1音频解码器的原理框图逆变换器重建 frame unpacking PCM声音 MPEG-1 音频比特流辅助数据进行差错检测、比特流分解,恢复出各种信息段恢复被量化的子带样本值以重建声音信号逆变换模块将这些样本从频率域变换回时间域中均匀的声音样本小结层 1: 每帧一个样本组、子带频宽相等、每帧32×12＝384个样本、仅用到频率掩蔽效应。层 2:每帧三个样本组、子带频宽相等、每帧32×12×3＝1152个样本、不仅用到频率掩蔽效应，还用到时域掩蔽效应。层 3: 子带频宽与临界频宽相似, 用到频率掩蔽效应和时域掩蔽效应, 考虑到立体声冗余, 采用Huffman编码。 MPEG-2音频 MPEG-2音频 (1) MPEG-2 Audio(ISO/IEC 13818-3)，或者称为MPEG-2多通道(Multichannel)声音，又称为MPEG-2 BC (Backward Compatible)。 (2) MPEG-2 AAC (ISO/IEC 13818-7, Advanced Audio Coding)，也称为MPEG-2 NBC(Non-Backward-Compatible)标准。 MPEG-2 Audio(13818-3) MPEG-2 Audio 增加了16 kHz, 22.05 kHz和24 kHz采样频率声音的处理，扩展了编码器的输出速率范围，由32~384 kbps扩展到8~640 kbps，增加了声道数，支持5.1声道和7.1声道的环绕立体声。 MPEG-2 音频编码器 16, 22.05, 24, 32, 44.1, 48kHz 8~640 kbps MPEG-2的环绕立体声 MPEG-2 Audio的“5.1环绕立体声”也称为“3/2-立体声加LFE”，放音现场前方有3个喇叭 (左、中、右3个声道)，后面有2个喇叭(2个环绕声道)，“.1”指LFE(low frequency effects)，即低频音效加强声道。 MPEG Audio的应用优点: 声音品质优良码率范围较宽多种不同配置四大应用领域: 广播, 存储, 多媒体通讯 MPEG-2 AAC (Advanced Audio Coding)（ISO/IEC 13818-7 ） MPEG-2 AAC的性能取样频率: 从8 kHz到96 kHz，编码器输入: 单声道、立体声和多声道声音。最多可支持: 48个主声道、16个低频音效通道LFE (low frequency effects)、16个配音声道(也称为多语言声道) 和16个数据流。在压缩比为11:1(即每个声道数据率为44.1× 16/11 = 64kbps)，5声道的总码率为320 kbps的情况下，重建声音与原始声音之间几乎无区别。音质相同时，码率仅MP2的50%, MP3的70% MPEG-2 AAC 的特点比MP3更加灵活, 如：取样频率和码率的范围更大, 声道数目更多, 具有多语言能力, 支持16个嵌入数据流等，编码器/解码器的结构是模块化的 AAC使用了更加先进的算法及工具, 如：分辨率更精细的滤波器组, 时域噪音定形（ temporal noise shaping，TNS）, 反向自适应线性预测(backward adaptive linear prediction), 联合立体声编码技术（joint stereo coding techniques）改进的 Huffman coding, MPEG-2 AAC编码器输入信号 13818-7声音数据流过去帧的量化频谱迭代环由多相正交滤波器、增益检测器和增益修正器组成。它把输入信号分离到4个相等带宽的频带中，通过忽略高频带信号而获得低取样率的输出信号，从而达到取样频率可调的目的。输入信号 13818-7声音数据流迭代环过去帧的量化频谱把输入信号从时域变换到频域，采用了改进的离散余弦变换MDCT，它是一种线性正交交迭变换，使用了一种称为时域去混迭技术. 输入信号 13818-7声音数据流迭代环过去帧的量化频谱用来控制量化噪声，以解决掩蔽阈值和量化噪声的错误匹配问题。输入信号 13818-7声音数据流迭代环过去帧的量化频谱联合立体声编码, 目的是为了去掉声道之间的冗余信息。包含两种空间编码技术：M/S编码(Mid/Side encoding)和声强/耦合(Intensity /Coupling)。输入信号 13818-7声音数据流迭代环过去帧的量化频谱主要用来减少平稳(stationary)声音信号的冗余度。输入信号 13818-7声音数据流迭代环过去帧的量化频谱对被量化的谱系数、比例因子和