第3章音频信息处理技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6. 成帧 图3.4-12 AAC码流帧结构 7. AAC的分级 MPEG-2标准的AAC定义了三种架构:主级(Main Profile)、低复杂度级(Low Complexity Profile, LC)和取样率可分级(Scalable Sampling Rate Profile,SSR)。 3.4.4 AC-3 图3.4-13 AC-2编码器原理框图 1. AC-3帧结构 图3.4-14 AC-3数据帧结构 2 AC-3编解码技术 图3.4-15 AC-3编码器原理框图 1) 分析滤波器组 分析滤波器组的任务是将音频信号的表示从时域变换到频域,分析滤波器采用TDAC变换。 2) 指数编码——谱包络编码 为了减少指数编码所需的数据量,AC-3采用了两种方法:一是AC-3指数的发送采用差分编码,二是争取在一个帧内的六个块使用同一个指数集。 3) 比特分配 比特分配就是将可分配的比特按最佳的方式分配给各个尾数。比特分配程度有两种调整方法,这两种方法是: (a) 反向自适应 (Backward Adaptive)。核心比特分配算法要利用反馈回到编码器在码流中的一些已编码的音频信息,用它来计算精确的比特分配。 (b) 正向自适应 (Forward Adaptive):AC-3编码器可以用一个比解码器所用的更加完善的声心理学模型。 4) 尾数量化 尾数是经过粗量化的。每个尾数所需要的比特数可由一张对照表查到。 3. AC-3解码 图3.4-16 AC-3解码器 在音频解码过程中必须注意: (1) 如果检测到一个数据错误,可以应用误码隐藏或静噪。 (2) 一些声道的高频内容已耦合的必须去耦合。 (3) 在信道被重新矩阵化时,必须进行解除矩阵化(在双声道模式)。 (4) 与编码器的解析滤波器组在编码过程中被改变一样,必须动态地改变合成滤波器组的分辨率。 3.5 常见多媒体应用的语音编码器的选择 多媒体应用 网络和速率 编码器选择 可视电话/会议 和远程教学 ISDN、ATM和帧中继 带宽56~128kb/s G.722 G.728 速率更低 G.723.1 带有数据共享的商务会议 企业Intranet或Internet G.722、G.728和G.729 单用户游戏 速率最低 参数编码器LPC 远程站点的 多用户游戏 速率低 低复杂度的编码器 多媒体信息传送 G.729 G.723.1 语音注释文档 低速率编码器 表3.5-1 常见多媒体应用的语音编码器的选择 图3.3-7 子带编码的原理框图 信号输入 带通滤波1 带通滤波2 带通滤波n 编码器 编码器 编码器 译码器 译码器 译码器 带通滤波1 带通滤波2 带通滤波n 信号输出 输出 输入 分 配 器 综 合 器 3.3.3 子带编码 (a) 信号输入 输入缓冲 变换 量化编码 边信息提取 比特分配量阶尺寸谱插值 合 路 编码输出 (b) 编码输入 分 路 解码 反变换 输出缓冲 比特分配量阶尺寸谱插值 图3.3-8 自适应变换编解码原理框图 (a) 编码;(b) 解码 3.3.4 变换域编码 3.3.5 矢量量化 信号序列输入 构成矢量 矢量码本 搜索 传送下标 矢量码本 传送下标 查表 矢量输出 … 图3.3-9 矢量量化编码及解码原理框图 码本的设计,目前最常用的是LBG算法。此算法的步骤为: (1) 采集用于构造码本的训练数据。数据越多,采集对象越广泛 则训练出的码本越好。  (2) 构造初始码本。它有许多方法。例如,常用的随机码本、白噪声码本等。 (3) 训练数据对已有的码本进行矢量量化编码,对每个码字形成数据聚类。  (4) 根据量化得到的聚类结果修正码字,即寻找每一类的新的代表性码字。  (5) 判断(3)中量化编码误差是否小于规定数值, 或者迭代次数是否超过规定值,若是,训练结束。否则转(3)继续。 矢量量化编码的关键技术的另一个方面是量化编码准则问题,这与被编码对象特性有关。举例来说,若直接对输入语音波形进行矢量量化,则多用最小均方误差MSE (Mean-Squared-Error) 准则: 其中,Yi是码本中第i个码字,每个码字有m维; 是权函数;d是误差值。 若矢量量化编码的对象是语

文档评论(0)

beoes + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档