第三章语音编码说课.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 话音编码 3.1 话音编码概要 3.2 脉冲编码调制(PCM) 3.3 PCM在通信中的应用 3.4 增量调制与自适应增量调制 3.5自适应差分脉冲编码调制 3.6 G.722 SB-ADPCM编译码器 3.7 线性预测编码(LPC)的概念 3.8 GSM编译码器简介 3.1 话音编码概要 一、话音波形的特性 声道可以认为是一个滤波器,压缩空气通过声门激励声道滤波器,根据激励方式不同,发出的话音分成三种类型: 浊音(voiced sounds): 清音(unvoiced sounds) 爆破音(plosive sounds)。 3.1 话音编码概要 浊音:浊音是一种称为准周期脉冲(quasi-periodic pulses)激励所发出的音,这种准周期脉冲是在声门打开然后关闭时中断肺部到声道的气流所产生的脉冲。 3.1 话音编码概要 清音:清音是由不稳定气流激励所产生的,这种气流是在声门处在打开状态下强制空气在声道里高速收缩产生的。 3.1 话音编码概要 爆破音:爆破音是在声道关闭之后产生的压缩空气然后突然打开声道所发出的音。 3.1 话音编码概要 二、三种话音编译码器 话音编译码器分成以下三种类型: 波形编译码器(waveform codecs):话音质量高,但数据率也很高 音源编译码器(source codecs):数据率很低,产生的合成话音的音质差 混合编译码器(hybrid codecs):数据率和音质介于它们之间 3.1 话音编码概要 3.1 话音编码概要 1、波形编译码器 最简单的波形编码是脉冲编码调制(pulse code modulation,PCM),它仅仅是对输入信号进行采样和量化。 可采用非线性量化来降低数据率,如μ律和A律。 优点是编译码器简单,延迟时间短,音质高 缺点是数据速率比较高,对传输通道的错误比较敏感。 3.1 话音编码概要 预测技术:从过去的样本来预测下一个样本的值 差分脉冲编码调制(differential pulse code modulation,DPCM)的基础—对预测的样本值与原始的样本值之差进行编码 3.1 话音编码概要 DPCM对幅度急剧变化的输入信号会产生比较大的噪声,改进的方法之一就是使用自适应的预测器和量化器——自适应差分脉冲编码调制(adaptive differential PCM,ADPCM) 有16,24,32,40 kb/s的ADPCM标准。其中32 kb/s的ADPCM标准的音质非常接近64 kb/s的PCM编译码器。 3.1 话音编码概要 时域法(time domain approach):在时域里的编译码方法,如DPCM、ADPCM。 频域法(frequency domain approach):如子带编码和自适应变换编码。 3.1 话音编码概要 3.1 话音编码概要 自适应变换编码(adaptive transform coding,ATC):使用快速变换(例如离散余弦变换)把话音信号分成许许多多的频带,用来表示每个变换系数的位数取决于话音谱的性质。 3.1 话音编码概要 2、音源编译码器 从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 针对话音的音源编译码器叫做声码器(vocoder)。 声道被等效成一个随时间变化的滤波器,叫做时变滤波器。 如LPC(线性预测编码)。 3.1 话音编码概要 3. 混合编译码 利用波形编码的高质量和音源编码的高压缩率。 如时域合成-分析(analysis-by-synthesis,AbS)编译码器:使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding,LPC)使用的模型相同,但不使用两个状态(有声/无声)的模型来寻找滤波器的输入激励信号,而使用其它的激励信号。 3.1 话音编码概要 多脉冲激励(multi-pulse excited,MPE)编译码器等间隔脉冲激励(regular-pulse excited,RPE)编译码器 码激励线性预测(code excited linear predictive,CELP)编译码器 混合激励线性预测(mixed excitation linear prediction,MELP)等 3.1 话音编码概要 MPE,RPE和CELP编译码器之间的差别在于所使用的激励信号的表示方法: MPE中,对每帧话音所用的激励信号u(n)是固定数目的脉冲; RPE编译码器使用固定间隔的脉冲,但脉冲的数目则比MPE使用的数目多; CELP使用的激励信号是量化矢量,激励信号

文档评论(0)

ss55863378 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档