数字通信技术 普通高等教育“十一五”国家级规划教材 教学课件 作者 张杭 张邦宁 郭道省 王孝国 陈瑾 02-2.pptVIP

数字通信技术 普通高等教育“十一五”国家级规划教材 教学课件 作者 张杭 张邦宁 郭道省 王孝国 陈瑾 02-2.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字通信技术 普通高等教育“十一五”国家级规划教材 教学课件 作者 张杭 张邦宁 郭道省 王孝国 陈瑾 02-2.ppt

;;§2.3 语音的产生模型和LPC声码器; 人的发声系统由声带(声门)、声道以及次声门组成,次声门又由肺和气管等组成,是语音的激励源。;一、语音信号的基本特性;10;t;一、语音信号的基本特性; 以上是一段话的语音波形和它在时间轴上的展宽波形;一、语音信号的基本特性;语音信号波形及其短时谱;激励源等效为基音频率的周期性脉冲或具有平坦频谱的 白噪声,声道等效为时变线性数字滤波器。 当激励源采用周期脉冲源时,声道输出的是浊音,采用 白噪声源时,声道输出的是清音。 ;二、语音信号的产生模型;全极点数字滤波器;产生语音信号s(n)的参量 清/浊音类型; 基音周期TP; 代表声道的时变滤波器的系数{aj}及滤波器阶数p; 增益系数G;;清浊音 判决;1、全极点数字滤波器参数的确定 阶数P 模型阶数P的选择,应该从频谱估计精度、计算量、存 储量等多方面综合进行考虑。 P取很大值时,可以获得很好的信号谱估计,但增加 的计算量和存储量代价太大。语音谱估计时主要关心 的是声道的谐振特性,P值过大,估计的谱中保留许 多信号谱细节,反而使共振峰分析效果变坏。 阶数P的经验值在8--12之间。通常采用10个极点的滤 波器,模型就能正确描述共振峰特性和谱的基本形状。;滤波器系数{aj};三、LPC声码器的工作原理;三、LPC声码器的工作原理; 基本原理:利用语音信号的时域波形的相似性,通过比较原始信号和它的移位信号的相似程度来寻找基音周期。如果移位的距离等于基音周期,则两个信号之间将具有最大的相似性。 常用方法:短时自相关函数和短时平均幅度差函数AMDF。; 设sw(n)是一段加窗的语音信号,它的非零区域为:n = 0?N-1。 ;三、LPC声码器的工作原理;三、LPC声码器的工作原理; 设sw(n)是一段加窗的语音信号,它的非零区域为:n = 0 ? N-1。 sw(n)的短时平均幅度差函数rw(l)定义为:;三、LPC声码器的工作原理;周期性语音信号短时自相关函数和AMDF示例;两种基音周期估计方法比较 AMDF方法计算简单,只需减法和取幅度运算,不需要乘法运算。 AMDF的动态范围较小,易于算法的定点实现。 AMDF在基音周期点上,它的谷点锐度较之短时自相关函数的峰点锐度更尖锐,估值精度更高、更稳健。但信号不够平稳时,这个特点不明显。 短时自相关函数法的特点是对相位不敏感,在信号有相位失真时能较好地检测基音。; 窗长 为了使较好地反映sw(n)的周期性,窗长 N 至少应大 于两个基音周期,一般取长度为10-30ms。 克服共振峰特性造成的干扰 由于共振峰的干扰,会出现Rw(l)的第一最大峰值点或 rw(l)的第一最深谷值点与基音周期不一致的情况,当 基音周期性和共振峰周期性混在一起时,检测出来的 周期可能是Np?Nf(Np是基音周期, Nf是第一共振峰的 周期)。 ;克服上述干扰有两种方法: 用低通滤波器(60Hz?900Hz)对语音信号进行滤波,去除大部分共振峰的影响,基音频率最高约450Hz,滤波后可以保留其一、二次谐波。 先对语音信号进行非线性变换(例如“中心削波”),然后再求Rw(l)或rw(l),这样可以明显地改善基音估计的效果,基音周期点上,峰值点或深谷值点比削波前得到的要尖锐、突出。 ; 中心削波中,为了保证表征基音周期的峰值不被削掉,削波电平CL的选择很重要。由于语音信号的电平变化很大,不宜选择固定电平,通常是找到语音帧的前1/3和最后1/3内的最大幅度,选取二值中较小的幅值,削波电平取其60%~80%即可,通常定为68%。; 对于加窗的语音信号sw(n),当窗的起点 n = 0 时,语音信号sw(n)的短时能量用E 表示,短时平均幅度用M 表示,计算公式如下:; 语音信号的过零率用Z 表示,它表示一帧语音信号中波形穿过横轴(零电平)的次数。它可以用相邻两个取样改变符号的次数来计算:; 浊音(V)的M 最大而Z 最低,当采样率为8kHz,帧长为 20ms 时, Z 的平均值约为20; 清音(U)的M 居中而Z 最高,当采样率为8kHz,帧长为20ms时, Z 的平均值约为70; 无声(S)的M 最低而Z 居中。;三、LPC声码器的工作原理;四、LPC10声码器;1、LPC10声码器概况 LPC-10声码器采用10阶线性预测分析滤波器,编码速率为2.4kb/s,被美国在1981年作为联邦标准FS-1015用于窄带保密通信。其语音质量清晰可懂,但抗噪声的能力和自然度尚有欠缺。 ;四、LPC10声码器; LPC-

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档