- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 称为码本激励编码。是一组更加复杂的编码器 * * * * H.324是基于PSTN的视频会议系统,同样也规定了视频和语音编解码的标准、复接、解复接和控制一整套协议。 * * * * * * * * * * * * * * * * * * 国际电话电报谘询委员会(ccitt) * * * * * * * * * * * * * * * * * * * * * 浊音段的波形举例,音节周期大约8ms 浊音段的功率谱密度 清音段的波形举例 清音段的功率谱密度举例 * * 音源编码 针对话音的音源编译码器叫做声码器。 声码器的原理是模仿人类发音器官喉、嘴、舌的组合,将该组合看作一个滤波器,人发出的声音使声带振动就成为激励脉冲。当然“滤波器” 脉冲频率在不断地变换,但在很短的时间(10ms~30ms)内观察它,则发音器官是没有变换的,因此声码器要做的事是将话音信号分成20ms的段,然后分析这一时间段内所对应的滤波器的参数,并提取此时的脉冲串频率,输出其激励脉冲序列。 话音生成模型 周期脉冲序列发生器 伪随机噪声产生器 周期 时变数字滤波器 音量控制 声道参数 语音 输出 浊/清选择 * * 线性预测编码(LPC) 线性预测编码(linear predictive coding,LPC)是音源编码(参数编码)的一种。 LPC通过分析话音波形产生声道激励和转移函数的参数,对声音波形的编码实质就是对这些参数进行编码 接收端根据这些参数通过语音合成器重构话音。 合成器是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。LPC要编码的就是这滤波器的系数。 * 预测概念 线性预测编码(LPC) 滤波器又是预测器,它描述为过去P个样本的线性组合。 LPC假定由无声话音段(白噪声)激励 或有声话音段(脉冲串)激励。解码时,需知道滤波器参数外,还需知道采用何种激励及其特征如何。 * 音源编码 简化的声音生成模型 声道模型 残差误差(residual error)即线性预测误差为 * 混合编译码 混合编译码的想法是企图填补波形编译码和音源编译码之间的间隔。 波形编译码器虽然可提供高话音的质量,但数据率低于16 kb/s的情况下,在技术上还没有解决音质的问题; 声码器的数据率虽然可降到2.4 kb/s甚至更低,但它的音质根本不能与自然话音相提并论。 * 混合编译码 为了得到音质高而数据率又低的编译码器,历史上出现过很多形式的混合编译码器,但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis, AbS)编译码器。 这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding,LPC)使用的模型相同,不使用两个状态(有声/无声)的模型来寻找滤波器的输入激励信号,而是企图寻找一种激励信号,使用这种信号激励产生的波形尽可能接近于原始话音的波形。 * 时域合成-分析编码 (AbS) 混合编码 AbS通过调节激励信号u,使话音输入s与重构信号之差为最小。它通过合成许多不同的近似值来分析输入话音信号,这正是其名称的由来。 译码器端根据滤波器的参数和激励信号,通过合成滤波器重构话音。 * 混合编码 AbS编译码器由Atal和Remde在1982年首次提出,并命名为多脉冲激励(multi-pulse excited,MPE)编译码器,在此基础上随后出现的是等间隔脉冲激励(regular-pulse excited,RPE)编译码器、码激励线性预测CELP(code excited linear predictive)编译码器和混合激励线性预测(mixed excitation linear prediction,MELP)等编译码器。 MPE,RPE和CELP编译码器之间的差别在于所使用的激励信号的表示方法。 码激励线性预测(CELP)编码 它试图通过复杂的激励描述机制来弥补简单的LPC模型在语音质量上的缺陷。它使用一个完整的激励向量集合,即一个码本,来和真实的语音匹配,把最佳匹配项的序号发送出去。与仅使用双状态激励的LPC相比,CELP的声音质量好得多,可以满足音频会议要求。 在CELP中使用两种预测方法来消除信号冗余,长时预测LTP和短时预测STP。 * * CCITT和ISO先后提出了一系列有关音频的编码建议。 分别应用于窄带话音信号、宽带话音信号、图像伴音信号、数字移动通信GSM信号等等。 3.1.2 编码标准介绍 * 音频编码算法和标准一览 算法 名称 数据率 标准 应用 质量 波 形 编 码 PCM 均匀量化 公用网 ISDN配音
文档评论(0)