数字通信技术普通高等教育“十一五”国家级规划教材教学课件作者张杭张邦宁郭道省王孝国陈瑾 02-2.pptVIP

下载本文档

1
0
约3.5千字
约 58页
2017-04-25 发布于湖南
举报
版权申诉

数字通信技术普通高等教育“十一五”国家级规划教材教学课件作者张杭张邦宁郭道省王孝国陈瑾 02-2.ppt

1、本文档共58页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数字通信技术普通高等教育“十一五”国家级规划教材教学课件作者张杭张邦宁郭道省王孝国陈瑾 02-2.ppt

;;§2.3 语音的产生模型和LPC声码器; 人的发声系统由声带（声门）、声道以及次声门组成，次声门又由肺和气管等组成，是语音的激励源。;一、语音信号的基本特性;10;t;一、语音信号的基本特性; 以上是一段话的语音波形和它在时间轴上的展宽波形;一、语音信号的基本特性;语音信号波形及其短时谱;激励源等效为基音频率的周期性脉冲或具有平坦频谱的白噪声，声道等效为时变线性数字滤波器。当激励源采用周期脉冲源时，声道输出的是浊音，采用白噪声源时，声道输出的是清音。 ;二、语音信号的产生模型;全极点数字滤波器;产生语音信号s(n)的参量清/浊音类型；基音周期TP；代表声道的时变滤波器的系数{aj}及滤波器阶数p；增益系数G；;清浊音判决;1、全极点数字滤波器参数的确定阶数P 模型阶数P的选择，应该从频谱估计精度、计算量、存储量等多方面综合进行考虑。 P取很大值时，可以获得很好的信号谱估计，但增加的计算量和存储量代价太大。语音谱估计时主要关心的是声道的谐振特性，P值过大，估计的谱中保留许多信号谱细节，反而使共振峰分析效果变坏。阶数P的经验值在8--12之间。通常采用10个极点的滤波器，模型就能正确描述共振峰特性和谱的基本形状。;滤波器系数{aj};三、LPC声码器的工作原理;三、LPC声码器的工作原理; 基本原理：利用语音信号的时域波形的相似性，通过比较原始信号和它的移位信号的相似程度来寻找基音周期。如果移位的距离等于基音周期，则两个信号之间将具有最大的相似性。常用方法：短时自相关函数和短时平均幅度差函数AMDF。; 设sw(n)是一段加窗的语音信号，它的非零区域为：n = 0?N-1。 ;三、LPC声码器的工作原理;三、LPC声码器的工作原理; 设sw(n)是一段加窗的语音信号，它的非零区域为：n = 0 ? N-1。 sw(n)的短时平均幅度差函数rw(l)定义为：;三、LPC声码器的工作原理;周期性语音信号短时自相关函数和AMDF示例;两种基音周期估计方法比较 AMDF方法计算简单，只需减法和取幅度运算，不需要乘法运算。 AMDF的动态范围较小，易于算法的定点实现。 AMDF在基音周期点上，它的谷点锐度较之短时自相关函数的峰点锐度更尖锐，估值精度更高、更稳健。但信号不够平稳时，这个特点不明显。短时自相关函数法的特点是对相位不敏感，在信号有相位失真时能较好地检测基音。; 窗长为了使较好地反映sw(n)的周期性，窗长 N 至少应大于两个基音周期，一般取长度为10-30ms。克服共振峰特性造成的干扰由于共振峰的干扰，会出现Rw(l)的第一最大峰值点或 rw(l)的第一最深谷值点与基音周期不一致的情况，当基音周期性和共振峰周期性混在一起时，检测出来的周期可能是Np?Nf（Np是基音周期， Nf是第一共振峰的周期）。 ;克服上述干扰有两种方法: 用低通滤波器（60Hz?900Hz）对语音信号进行滤波，去除大部分共振峰的影响，基音频率最高约450Hz，滤波后可以保留其一、二次谐波。先对语音信号进行非线性变换（例如“中心削波”），然后再求Rw(l)或rw(l)，这样可以明显地改善基音估计的效果，基音周期点上，峰值点或深谷值点比削波前得到的要尖锐、突出。 ; 中心削波中，为了保证表征基音周期的峰值不被削掉，削波电平CL的选择很重要。由于语音信号的电平变化很大，不宜选择固定电平，通常是找到语音帧的前1/3和最后1/3内的最大幅度，选取二值中较小的幅值，削波电平取其60%～80%即可，通常定为68％。; 对于加窗的语音信号sw(n)，当窗的起点 n = 0 时，语音信号sw(n)的短时能量用E 表示，短时平均幅度用M 表示，计算公式如下：; 语音信号的过零率用Z 表示，它表示一帧语音信号中波形穿过横轴（零电平）的次数。它可以用相邻两个取样改变符号的次数来计算：; 浊音（V）的M 最大而Z 最低，当采样率为8kHz，帧长为 20ms 时， Z 的平均值约为20；清音（U）的M 居中而Z 最高，当采样率为8kHz，帧长为20ms时， Z 的平均值约为70；无声（S）的M 最低而Z 居中。;三、LPC声码器的工作原理;四、LPC10声码器;1、LPC10声码器概况 LPC-10声码器采用10阶线性预测分析滤波器，编码速率为2.4kb/s，被美国在1981年作为联邦标准FS-1015用于窄带保密通信。其语音质量清晰可懂，但抗噪声的能力和自然度尚有欠缺。 ;四、LPC10声码器; LPC-

您可能关注的文档

文档评论（0）

带头大哥 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

数字通信技术普通高等教育“十一五”国家级规划教材教学课件作者张杭张邦宁郭道省王孝国陈瑾 02-2.pptVIP