第3章音频信息处理技术.pptVIP

下载本文档

6
0
约1.04万字
约 101页
2019-07-05 发布于湖北
举报
版权申诉

第3章音频信息处理技术.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

6. 成帧图3.4-12 AAC码流帧结构 7. AAC的分级 MPEG-2标准的AAC定义了三种架构：主级(Main Profile)、低复杂度级(Low Complexity Profile, LC)和取样率可分级(Scalable Sampling Rate Profile，SSR)。 3.4.4 AC-3 图3.4-13 AC-2编码器原理框图 1. AC-3帧结构图3.4-14 AC-3数据帧结构 2 AC-3编解码技术图3.4-15 AC-3编码器原理框图 1) 分析滤波器组分析滤波器组的任务是将音频信号的表示从时域变换到频域，分析滤波器采用TDAC变换。 2) 指数编码——谱包络编码为了减少指数编码所需的数据量，AC-3采用了两种方法：一是AC-3指数的发送采用差分编码，二是争取在一个帧内的六个块使用同一个指数集。 3) 比特分配比特分配就是将可分配的比特按最佳的方式分配给各个尾数。比特分配程度有两种调整方法，这两种方法是： (a) 反向自适应 (Backward Adaptive)。核心比特分配算法要利用反馈回到编码器在码流中的一些已编码的音频信息，用它来计算精确的比特分配。 (b) 正向自适应 (Forward Adaptive)：AC-3编码器可以用一个比解码器所用的更加完善的声心理学模型。 4) 尾数量化尾数是经过粗量化的。每个尾数所需要的比特数可由一张对照表查到。 3. AC-3解码图3.4-16 AC-3解码器在音频解码过程中必须注意： (1) 如果检测到一个数据错误，可以应用误码隐藏或静噪。 (2) 一些声道的高频内容已耦合的必须去耦合。 (3) 在信道被重新矩阵化时，必须进行解除矩阵化（在双声道模式）。 (4) 与编码器的解析滤波器组在编码过程中被改变一样，必须动态地改变合成滤波器组的分辨率。 3.5 常见多媒体应用的语音编码器的选择多媒体应用网络和速率编码器选择可视电话/会议和远程教学 ISDN、ATM和帧中继带宽56~128kb/s G.722 G.728 速率更低 G.723.1 带有数据共享的商务会议企业Intranet或Internet G.722、G.728和G.729 单用户游戏速率最低参数编码器LPC 远程站点的多用户游戏速率低低复杂度的编码器多媒体信息传送 G.729 G.723.1 语音注释文档低速率编码器表3.5-1 常见多媒体应用的语音编码器的选择图3.3-7 子带编码的原理框图信号输入带通滤波1 带通滤波2 带通滤波n 编码器编码器编码器译码器译码器译码器带通滤波1 带通滤波2 带通滤波n 信号输出输出输入分配器综合器 3.3.3 子带编码 (a) 信号输入输入缓冲变换量化编码边信息提取比特分配量阶尺寸谱插值合路编码输出 (b) 编码输入分路解码反变换输出缓冲比特分配量阶尺寸谱插值图3.3-8 自适应变换编解码原理框图 (a) 编码；(b) 解码 3.3.4 变换域编码 3.3.5 矢量量化 信号序列输入构成矢量矢量码本搜索传送下标矢量码本传送下标查表矢量输出 … 图3.3-9 矢量量化编码及解码原理框图码本的设计，目前最常用的是LBG算法。此算法的步骤为： (1) 采集用于构造码本的训练数据。数据越多，采集对象越广泛则训练出的码本越好。  (2) 构造初始码本。它有许多方法。例如，常用的随机码本、白噪声码本等。 (3) 训练数据对已有的码本进行矢量量化编码，对每个码字形成数据聚类。  (4) 根据量化得到的聚类结果修正码字，即寻找每一类的新的代表性码字。  (5) 判断(3)中量化编码误差是否小于规定数值，或者迭代次数是否超过规定值，若是，训练结束。否则转(3)继续。矢量量化编码的关键技术的另一个方面是量化编码准则问题，这与被编码对象特性有关。举例来说，若直接对输入语音波形进行矢量量化，则多用最小均方误差MSE (Mean-Squared-Error) 准则：其中，Yi是码本中第i个码字，每个码字有m维；是权函数；d是误差值。若矢量量化编码的对象是语