- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《语音信号处理》讲稿第6章.ppt
第6章 语音合成 本章主要讨论的问题: 1.语音合成原理和方法 2.线性预测合成技术 3.语音音素合成技术 1.语音合成原理和方法 共振峰语音合成原理如下: ①浊音和清音分别采用不同的激励源。 ②发不同语音对应不同声道路径和滤波器。 ③发不同语音对应不同幅值控制和频率控制。 ④共振峰和基频是语音信号的2个主要特征。 Vortax公司推出的Computalker是一种典型的语音合成产品——最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。 共振峰模型分为级联型、并联型、混合型三类。 对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。 混合型共振峰语音合成模型 2.线性预测合成技术 线性预测技术有两个特点: a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。 b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。 2.线性预测合成技术 (1)线性预测原理 线性预测技术可以看成是一种曲线的拟合技术。 预测误差e(n)的表达式: e(n)= x(n)-x^(n) = x(n)-∑akx(n-k) 式中,x^(n)=∑akx(n-k)为预测值,ak为预测系数。 2.线性预测合成技术 将预测误差e(n)的表达式进行Z变换得: E(Z)=X(Z)(1-∑akZ-k) 由此,可得 X(Z)= E(Z)·[1/(1-∑akZ-k)] 此式即为语音的合成模型。 2.线性预测合成技术 对上式进一步化简,得: X(Z) = H(Z)I(Z) 其中,H(Z)=1/(1-∑akZ-k)为模拟声道滤波器传递函数。I(Z)为频谱分布为0dB/倍频程的脉冲激励源,即I(Z)=E(Z)。 上式表明:利用线性预测可以把模拟声道的滤波器和模拟声源的脉冲激励分离开来。均方误差最小时,浊音对应脉冲波激励,清音对应白噪声。 线性预测用于共振峰分析,如图所示。 线性预测用于共振峰分析 2.线性预测合成技术 线性预测编码(LPC)的关键问题是在均方误差最小条件下求出线性预测系数ak。此时,由x^(n)=∑akx(n-k)可近似地恢复x(n)。 目前,有3种求线性预测系数ak的方法:直接法、自相关法、协方差法。 2.线性预测合成技术 ①直接法 求解线性预测系数的直接法与求出曲线的拟合系数的方法相同。总的均方预测误差为: 2.线性预测合成技术 对M求偏导数,并使aj的偏导数为0,得: 2.线性预测合成技术 利用上式的p个线性联立方程,可求出p个线性预测系数a1,a2,…,ap。 这种求解方式在计算机上进行,很方便。n的求和范围一般为-∞n+∞。但考虑语音信号的特性,实际上,在一段时间求和(加窗函数?n),即 x(n)* = ?n·x(n) 窗函数的长度一般为100~250。 2.线性预测合成技术 ②自相关法 自相关法是上式的另一种解法。 设自相关函数为 2.线性预测合成技术 联立方程组可变换成: R(0)a1+R(1)a2+R(2)a3+…+R(p-1)ap =R(1) R(1)a1+R(0)a2+R(1)a3+…+R(p-2)ap =R(2) R(2)a1+R(1)a2+R(0)a3+…+R(p-3)ap =R(3) …… R(p-1)a1+R(p-2)a2+R(p-3)a3+…+R(0)ap =R(p) 这是一个系数对称的线性联立方程。Durbin和Levinson提出了求解这种特殊方程组的最佳解算法。 2.线性预测合成技术 ③协方差法 这种方法无需对语音信号加窗,它能精确算出预测系数,而在帧内的分析时间比自相关法要短。 这种方法假设n求和范围为定数N,起点在n=h处,计算样本数h到h+N-1时共N个样本值时的预测系数。此时,联立方程组可变换为: 2.线性预测合成技术 2.线性预测合成技术 因为Qhjk=Qhkj,可见上式是一个对角线对称的系数矩阵。矩阵Qh 是半正定,可近似地假设为正定。根据Cholesky定理,正定对称矩阵可进行如下分解: Q=LLT 其中,L为一个下三角阵,由此,可得一个有效的求解算法。 通常,用于计算预测系数的语音信号样本值在50~100之间,每隔100~250个样本值重新计算预测系数。 2.线性预测合成技术 (2)格型合成滤波器 根据以上3种方法,求得线性预测系
您可能关注的文档
最近下载
- Unit 6 Understanding ideas Longji Rice Terraces 课件-高中英语外研版(2019)必修第一册.pptx VIP
- 护理学导论(高职)教学教案.docx
- 2024年部编新改版语文六年级上册全册月考试题含答案(共4套).docx
- 饮用水和环境卫生公众健康宣教及风险沟通答案-2024年全国疾控系统“大学习”活动.docx VIP
- 新型冠状病毒、甲型和乙型流感病毒全预混冻干多重荧光PCR检测试剂盒及其检测方法发明专利.pdf VIP
- 基金会捐赠协议.doc VIP
- XX市智慧安居工程(一期)报警求助综合受理指挥分系详细设计方案.doc VIP
- 《乡土中国》 第11篇 《长老统治》.ppt
- [知识]职业生涯人物访谈(教师).pdf VIP
- 第六单元整本书阅读《西游记》课件 2024—2025学年统编版语文七年级上册.pptx VIP
文档评论(0)