音频压缩编码原理及标准技术方案.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MPEG-2BC 后向兼容多声道音频编码(与MPEG-1兼容) MPEG-2 AAC MPEG-2高级音频编码(与MPEG-1不兼容) MPEG-2 BC 后向兼容多声道音频编码标准 增加采样率16KHz、22.05KHz、24KHz 增加5.1声道和7.1声道环绕声 输出码率为8-640kbit/s ????????????????????????????????????????????????????????? MPEG-2 AAC 是MPEG-2标准中的一种非常灵活的声音感知编码标准。就像所有感知编码一样,MPEG-2 AAC主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。 与MPEG-1音频算法不兼容 采样频率支持从8KHz~96KHz 可支持48个主声道,16个LFE声道,16个多语言声道,16个数据流 数据率比MP3低,但音质更高。 MPEG-2 AAC 增益控制 把输入信号划分到4个等带宽的子带中。 分析滤波器组 输入信号从时域变换到频域。采用MDCT。 听觉系统感知模型 心理声学模型 瞬时噪声整形(TNS) 控制量化噪声的瞬时形状,解决掩蔽阈值和量化噪声的错误匹配问题。 声强/耦合和M/S编码 利用和、差方法产生中间和边声道代替原来的左右声道。 预测 在信号较平稳的情况下,利用时域预测减小信号的冗余度。 量化 无损编码 采用Huffman编码 码流打包组帧 MPEG-2 ACC的类 可分为三类: 主类:除了“增益控制”模块以外,使用其他所有模块。在三种类中提供最好的声音质量,但对计算机的存储容量和处理能力的要求较高。 低复杂度类:不使用预测模块和增益控制模块,瞬时噪声整形滤波器的级数也有限,声音质量比主类的声音质量低,但对计算机的存储容量和处理能力的要求明显降低。 可分级的采样率类:使用增益控制模块,不使用时域预测和声强/耦合模块,瞬时噪声整形滤波器的级数和带宽也都有限制。三类中最简单。 具有高度的灵活性和可扩展性。主要服务于低比特率下的多媒体通信。引入了音频对象(AO) 码率范围:2~64kb/s,提供三种类型编码器: 低比特率: 参数化编码器 中间比特率: 码激励线性预测编码器 高比特率: 时/频编码器 参数编码器 使用参数编码技术。 两种编码工具:谐波矢量激励编码、谐波和特征线加噪声编码。 码激励线性预测编码器 主要由激励源和合成滤波器组成。 时/频编码器 时域模块提取音频信号的增益信息 滤波器组通过DCT变换信号从时域变换到频域 心理声学模型对不同频段的频域信号采取相应的处理策略。 频域处理模块根据心理声学模块的参数处理各个频段的信号。 量化和编码部分对频域信号进行编码。 将高质量音频编码、计算机音乐及合成语音等合并在一起。 结构化音频交响乐语言(SAOL):标准核心的合成描述语言,使得合成算法的编辑变得更加简单容易。 结构化音频乐谱语言(SASL):简单乐谱和控制语言,用来描述在合成声音产生过程中用SAOL语言传输的声音产生算法是如何运作的。 结构化音频采样值分组格式(SASBF):允许传输在波表合成中使用的分组的音频采样值数据。 规范化程序表:描述了结构化音频解码过程的运行过程 规范化标准:用于MIDI标准。 波表合成(WAVE TABLE):对乐器声音取样,存贮为一个波表文件,重播时根据音乐文件记录的乐曲信息向波表发出指令,从表格中,逐一找出对应的声音信息。 声音信号从时域变为频域,用频率分量形式表示原信号,再对其频谱系数进行量化编码 量化编码过程中,利用心理声学模型,对频谱系数进行优化,来实现对音频数据进行有效的压缩 时频变化的方法:离散余弦变换DCT 、改进的离散余弦变换MDCT 离散余弦变换(DCT) 时频变换(DFT) 变换时将PCM样值分为N长的一块块进行变换 块长:一块中包含的样本数N 窗长:N ×(1/Fs) 频率分辨率:Fs/N 频率轴上的所能得到的最小频率间隔 块越长,变化编码的频率分辨率越高,但损失了时域分辨率 逆变换 离散余弦变换(DCT) 将原信号沿负方向延拓定义域,并合理选择对称坐标轴,使其正、负轴对称,这样信号变为实轴对称的偶函数,DFT变换后仅有余弦项而不存在正弦项,运算量大为减小。

文档评论(0)

5201394 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档