第十四讲语音信号处理第7章分析.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十四讲语音信号处理第7章分析

LPC参数的变换与量化 ①反射系数 : 对反射系数的值在【-1,1】区间一般进行非线性量化,另外比特数分配应递减。 ②对数面积比: 针对对数面积比的方式是最为有效的编码方式,很适合数字编码与传输: 其中Ai为面积函数,通过上式可知 幅度均匀分布,可以采用均匀量化。 变帧率LPC声码器 为降低LPC声码器的速率,应用了变帧速率编码(VFR)技术的变帧率LPC声码器应运产生。通过付出编解码复杂化与时延的代价,变帧率LPC声码器可明显降低传输数码率同时保持音质。 LPC-10编码器 LPC-10利用简单的二元激励取代余量信号,在2.4kbps的速率上得到了清晰的合成语音,在当代长期被作为标准算法使用。但因为激励信号选取的影响,抗噪能力与自然度仍不尽如人意。 7.5 语音信号的混合编码 20世纪80年代后期,综合了参数编码低比特率与波形编码高语音质量优点的混合编码得到广泛的使用。它在假定语音产生模型的同时将模型参数编码,吸收了两者的优点。 合成编码方法(LPAS)是目前最广泛研究的语音编码算法,它通过线性预测确定系统参数,并通过闭环或分析-合成方法确定激励序列。 码激励线性预测编码(CELP) CELP因其自身的良好抗噪性多次复接能力与高质量的合成语音而被广泛运用。不同于LPC的二元激励,CELP采用矢量量化对信号编码,编码时只传送最佳码矢量的下标,占用比特数大大降低。 CELP模型编码仍基于语音的短时特性,采用LAPS与矢量量化。在编码类型上,既采用了类似声源模型的语音合成方法,又做了波形的最佳匹配,所以同时具有参数编码与波形编码的特征,故称为混合编码。 * 7.1概述 7.2语音信号压缩编码原理和系统压缩评价 7.3语音信号的波形编码 7.4语音信号的参数编码 7.5语音信号的混合编码 7.1 概述 语音编码(Speech Coding) 从信息论角度看,信源编码是要以最少的数码表示信源所发的信号,语音编码属于信源编码的范畴。语音编码通过减少传输码率(或存储量),来达到提高传输(或存储)效率的目的。 语音编码分为三类: *波形编码:重建后的语音时域信号的波形与原语音信号保持一致。 *参数编码:通过建立语音信号的产生模型,提取其特征参数来编码,波形上不要求与原信号匹配,又称声码器技术。 *混合编码:有机结合以上两种编码方式,基于语音产生模型的假定并采用分析合并技术。 三种编码方式的比较 波形编码 参数编码 混合编码 编码信息 波形 模型参数 综合 比特率 9.6~64Kbps 2.4~9.6Kbps 16~24Kbps 优点 适应能力强,语音质量好 有效降低了编码比特率 语音质量明显提高 缺点 随着量化粗糙语音质量下降 合成语音质量低,处理复杂度高 编码速率明显上升 典型代表 自适应差分编码调制(ADPCM) LPC-10、LPC-10E 多脉冲激励线性预测编码(MPLPC) 规则脉冲激励线性预测编码(RPE-LPC) 7.2 语音信号压缩编码原理和系统压缩评价 语音信号中存在着冗余度(包括时域与频域),人的听觉感知机理也有很多可以利用的特点。语音信号压缩编码之所以可行,正是因为这两种情况的存在。 语音编码依据之一:语音信号冗余度 基本时域冗余: 语音信号幅度非均匀分布性 语音信号样本间的强相关性 浊音语音段具有的准周期性 声道形状及其变化的缓慢性 静止系数 (即语音间隙性) 基本频域冗余: 从长时间的功率谱密度来看,语音信号具有强烈的非平坦性,存在着固定的冗余度。而且高频能量通常较低,恰好对应于时域上的相邻样本相关性。 从短时功率谱密度来看,语音信号在不同频率交替出现峰值(共振峰)与谷值。整个功率谱的细节基于基音频率形成高次谐波结构。 语音编码依据之二:人的听觉特点 人类听觉系统存在着掩蔽效应,即高声级单音会明显掩蔽临近频率声音。 对于不同频段的声音,人耳的敏感程度不尽相同。 人类对于语音信号的周期性(即音调)极为敏感,但对信号的相位却充耳不闻。 语音编码中的几项关键技术 线性预测 线性预测传送整个反应过程变化的参数,其出发点在于跟踪波形的产生过程而非波形本身。基于全极点模型假设,使得语音信号编码的比特率得到有效的降低。 语音信号中存在的两点相关性 样点间的短时相关性 相邻基音周期之间的长时相关性 激励发生器 1 ———— P(z) 1 ———— A(z) 合成语音 语音信号合成模型图示 其中信号源为预测余量信号,1/P(z)为长时预测滤波器, 1/A(z)为短时预测

文档评论(0)

wbjsn + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档