MM07-3.1音频编码技术.pptVIP

下载本文档

5
0
约1.17万字
约 59页
2016-09-08 发布于安徽
举报
版权申诉

MM07-3.1音频编码技术.ppt

1、本文档共59页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * 称为码本激励编码。是一组更加复杂的编码器 * * * * H.324是基于PSTN的视频会议系统，同样也规定了视频和语音编解码的标准、复接、解复接和控制一整套协议。 * * * * * * * * * * * * * * * * * * 国际电话电报谘询委员会(ccitt) * * * * * * * * * * * * * * * * * * * * * 浊音段的波形举例，音节周期大约8ms 浊音段的功率谱密度清音段的波形举例清音段的功率谱密度举例 * * 音源编码针对话音的音源编译码器叫做声码器。声码器的原理是模仿人类发音器官喉、嘴、舌的组合，将该组合看作一个滤波器，人发出的声音使声带振动就成为激励脉冲。当然“滤波器” 脉冲频率在不断地变换，但在很短的时间（10ms～30ms）内观察它，则发音器官是没有变换的，因此声码器要做的事是将话音信号分成20ms的段，然后分析这一时间段内所对应的滤波器的参数，并提取此时的脉冲串频率，输出其激励脉冲序列。话音生成模型周期脉冲序列发生器伪随机噪声产生器周期时变数字滤波器音量控制声道参数语音输出浊/清选择 * * 线性预测编码(LPC) 线性预测编码（linear predictive coding，LPC）是音源编码（参数编码）的一种。 LPC通过分析话音波形产生声道激励和转移函数的参数，对声音波形的编码实质就是对这些参数进行编码接收端根据这些参数通过语音合成器重构话音。合成器是一个离散的随时间变化的时变线性滤波器，它代表人的话音生成系统模型。LPC要编码的就是这滤波器的系数。 * 预测概念线性预测编码(LPC) 滤波器又是预测器，它描述为过去P个样本的线性组合。 LPC假定由无声话音段(白噪声)激励或有声话音段(脉冲串)激励。解码时，需知道滤波器参数外，还需知道采用何种激励及其特征如何。 * 音源编码简化的声音生成模型声道模型残差误差(residual error)即线性预测误差为 * 混合编译码混合编译码的想法是企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量，但数据率低于16 kb/s的情况下，在技术上还没有解决音质的问题；声码器的数据率虽然可降到2.4 kb/s甚至更低，但它的音质根本不能与自然话音相提并论。 * 混合编译码为了得到音质高而数据率又低的编译码器，历史上出现过很多形式的混合编译码器，但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis, AbS)编译码器。这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding，LPC)使用的模型相同，不使用两个状态(有声/无声)的模型来寻找滤波器的输入激励信号，而是企图寻找一种激励信号，使用这种信号激励产生的波形尽可能接近于原始话音的波形。 * 时域合成-分析编码 (AbS) 混合编码 AbS通过调节激励信号u,使话音输入s与重构信号之差为最小。它通过合成许多不同的近似值来分析输入话音信号，这正是其名称的由来。译码器端根据滤波器的参数和激励信号，通过合成滤波器重构话音。 * 混合编码 AbS编译码器由Atal和Remde在1982年首次提出，并命名为多脉冲激励(multi-pulse excited，MPE)编译码器，在此基础上随后出现的是等间隔脉冲激励(regular-pulse excited，RPE)编译码器、码激励线性预测CELP(code excited linear predictive)编译码器和混合激励线性预测(mixed excitation linear prediction，MELP)等编译码器。 MPE，RPE和CELP编译码器之间的差别在于所使用的激励信号的表示方法。码激励线性预测（CELP）编码它试图通过复杂的激励描述机制来弥补简单的LPC模型在语音质量上的缺陷。它使用一个完整的激励向量集合，即一个码本，来和真实的语音匹配，把最佳匹配项的序号发送出去。与仅使用双状态激励的LPC相比，CELP的声音质量好得多，可以满足音频会议要求。在CELP中使用两种预测方法来消除信号冗余，长时预测LTP和短时预测STP。 * * CCITT和ISO先后提出了一系列有关音频的编码建议。分别应用于窄带话音信号、宽带话音信号、图像伴音信号、数字移动通信GSM信号等等。 3.1.2 编码标准介绍 * 音频编码算法和标准一览算法名称数据率标准应用质量波形编码 PCM 均匀量化公用网 ISDN配音