- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 语音合成 本章主要讨论的问题: 1.语音合成原理和方法 2.线性预测合成技术 3.语音音素合成技术 1.语音合成原理和方法 共振峰语音合成原理如下: ①浊音和清音分别采用不同的激励源。 ②发不同语音对应不同声道路径和滤波器。 ③发不同语音对应不同幅值控制和频率控制。 ④共振峰和基频是语音信号的2个主要特征。 Vortax公司推出的Computalker是一种典型的语音合成产品——最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。 共振峰模型分为级联型、并联型、混合型三类。 对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。 混合型共振峰语音合成模型 2.线性预测合成技术 线性预测技术有两个特点: a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。 b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。 2.线性预测合成技术 (1)线性预测原理 线性预测技术可以看成是一种曲线的拟合技术。 预测误差e(n)的表达式: e(n)= x(n)-x^(n) = x(n)-∑akx(n-k) 式中,x^(n)=∑akx(n-k)为预测值,ak为预测系数。 2.线性预测合成技术 将预测误差e(n)的表达式进行Z变换得: E(Z)=X(Z)(1-∑akZ-k) 由此,可得 X(Z)= E(Z)·[1/(1-∑akZ-k)] 此式即为语音的合成模型。 2.线性预测合成技术 对上式进一步化简,得: X(Z) = H(Z)I(Z) 其中,H(Z)=1/(1-∑akZ-k)为模拟声道滤波器传递函数。I(Z)为频谱分布为0dB/倍频程的脉冲激励源,即I(Z)=E(Z)。 上式表明:利用线性预测可以把模拟声道的滤波器和模拟声源的脉冲激励分离开来。均方误差最小时,浊音对应脉冲波激励,清音对应白噪声。 线性预测用于共振峰分析,如图所示。 线性预测用于共振峰分析 2.线性预测合成技术 线性预测编码(LPC)的关键问题是在均方误差最小条件下求出线性预测系数ak。此时,由x^(n)=∑akx(n-k)可近似地恢复x(n)。 目前,有3种求线性预测系数ak的方法:直接法、自相关法、协方差法。 2.线性预测合成技术 ①直接法 求解线性预测系数的直接法与求出曲线的拟合系数的方法相同。总的均方预测误差为: 2.线性预测合成技术 对M求偏导数,并使aj的偏导数为0,得: 2.线性预测合成技术 利用上式的p个线性联立方程,可求出p个线性预测系数a1,a2,…,ap。 这种求解方式在计算机上进行,很方便。n的求和范围一般为-∞n+∞。但考虑语音信号的特性,实际上,在一段时间求和(加窗函数?n),即 x(n)* = ?n·x(n) 窗函数的长度一般为100~250。 2.线性预测合成技术 ②自相关法 自相关法是上式的另一种解法。 设自相关函数为 2.线性预测合成技术 联立方程组可变换成: R(0)a1+R(1)a2+R(2)a3+…+R(p-1)ap =R(1) R(1)a1+R(0)a2+R(1)a3+…+R(p-2)ap =R(2) R(2)a1+R(1)a2+R(0)a3+…+R(p-3)ap =R(3) …… R(p-1)a1+R(p-2)a2+R(p-3)a3+…+R(0)ap =R(p) 这是一个系数对称的线性联立方程。Durbin和Levinson提出了求解这种特殊方程组的最佳解算法。 2.线性预测合成技术 ③协方差法 这种方法无需对语音信号加窗,它能精确算出预测系数,而在帧内的分析时间比自相关法要短。 这种方法假设n求和范围为定数N,起点在n=h处,计算样本数h到h+N-1时共N个样本值时的预测系数。此时,联立方程组可变换为: 2.线性预测合成技术 2.线性预测合成技术 因为Qhjk=Qhkj,可见上式是一个对角线对称的系数矩阵。矩阵Qh 是半正定,可近似地假设为正定。根据Cholesky定理,正定对称矩阵可进行如下分解: Q=LLT 其中,L为一个下三角阵,由此,可得一个有效的求解算法。 通常,用于计算预测系数的语音信号样本值在50~100之间,每隔100~250个样本值重新计算预测系数。 2.线性预测合成技术 (2)格型合成滤波器 根据以上3种方法,求得线性预测系
您可能关注的文档
最近下载
- 中华人民共和国职业技能鉴定规范:汽轮机本体检修工.docx VIP
- 智慧医疗分级评价方法及标准(2025版)(征意).docx
- NBT35002-2011水力发电厂工业电视系统设计规范.pdf VIP
- 建设100万高标准蛋鸡养殖场项目可行性研究报告写作模板-申批立项.doc
- 2025年第一季度入党积极分子思想汇报四篇.docx VIP
- 2025福建泉州鲤城区国有企业招聘15人考试备考题库及答案解析.docx VIP
- 核心素养背景下的高中语文课堂教学策略.pptx VIP
- 护理学基础-饮食护理.ppt VIP
- 色温色坐标互算公式.xls VIP
- 最近整理移动式升降机施工方案移动升降机施工方案.pdf VIP
文档评论(0)