四川大学计算机学院 多媒体技术 10.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四川大学计算机学院 多媒体技术 10

话音编码 三种类型话音编译码器: 波形编译码器(waveform codecs) 音源编译码器(source codecs) 混合编译码器(hybrid codecs) 话音编码 三种编译码器的音质与数据率 话音编码 1、波形编译码器 基本思想:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。 话音编码 两种波形编译码方法: 时域法(time domain approach) 脉冲编码调制 PCM 差分脉冲编码调制 DPCM 自适应差分脉冲编码调制 ADPCM 频域法(frequency domain approach) 子带编码 SBC 自适应变换编码 ATC 话音编码 脉冲编码调制 PCM(pulse code modulation)——最简单的波形编码,它仅仅是对输入信号进行采样和量化。 话音编码 “预测技术”: 从过去的样本来预测下一个样本的值。 根据:在话音样本之间存在相关性。 差分脉冲编码调制 DPCM(differential pulse code modulation): 对预测的样本值与原始的样本值之差进行编码 如果样本的预测值与样本的实际值比较接近,它们之间的差值幅度的变化就比原始话音样本幅度值的变化小,因此量化这种差值信号时就可以用比较少的位数来表示差值。 话音编码 自适应差分脉冲编码调制 ADPCM (adaptive differential PCM ) : 改进DPCM对幅度急剧变化的输入信号会产生比较大的噪声。 话音编码 子带编码SBC(sub-band coding,属于频域法) 输入的话音信号被分成好几个频带(即子带),变换到每个子带中的话音信号都进行独立编码;在接收端,每个子带中的信号单独解码之后重新组合,然后产生重构话音信号。 话音编码 SBC优点:每个子带中的噪声信号仅仅与该子带使用的编码方法有关系。对听觉感知比较重要的子带信号,编码器可分配比较多的位数来表示它们,于是在这些频率范围里噪声就比较低。反之,可以分配比较少的位数来表示重要性比较低的这些信号。 SBC缺点:比ADPCM编译码器复杂,且增加了更多的编码时延。 话音编码 自适应变换编码ATC(adaptive transform coding,属于频域法) 使用快速变换(例如离散余弦变换)把话音信号分成许许多多的频带,用来表示每个变换系数的位数取决于话音谱的性质。 话音编码 2. 音源编译码器 基本思想:从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 传送给解码器的信息就是滤波器的规格、发声或者不发声的标志和有声话音的音节周期,并且每隔10~20 ms更新一次。声码器的模型参数既可使用时域的方法也可以使用频域的方法确定 特点:数据率在2.4 kb/s左右,音质比较低,但保密性能好,一直用在军事上 。 话音编码 3. 混合编译码 想法:填补波形编译码和音源编译码之间的间隔 时域合成-分析编译码器 等间隔脉冲激励编译码器RPE( regular-pulse excited) 码激励线性预测编译码器CELP(code excited linear predictive) 混合激励线性预测编译码器MELP(mixed excitation linear prediction) 话音编码 时域合成-分析编译码器AbS(analysis-by-synthesis) 使用的声道线性预测滤波器模型与线性预测编码LPC(linear predictive coding)的模型相同;但企图寻找使用这种信号激励产生的波形尽可能接近于原始话音的波形的激励信号。 命名为多脉冲激励MPE(multi-pulse excited)编译码器(由Atal和Remde在1982年首次提出) 话音编码 AbS编译码器的一般结构 脉冲编码调制(PCM) PCM特点:概念上最简单、理论上最完善、最早研制成功、使用最为广泛、数据量最大的编码系统。 PCM编码框图 脉冲编码调制(PCM) 均匀量化与非均匀量化 脉冲编码调制(PCM) 非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔 m 律压扩(m -Law) 式中:x为输入信号幅度,规格化成 sgn(x)为x的极性; m 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100≤ m≤ 500。具体计算时,用m =255,把对数曲线变成8条折线以简化计算过程 由于m 律压扩的输入和输出关系是对数关系,又称为对数PCM。, 脉冲编码调制(PCM) A律压扩 (A-Law)

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档