- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《语音信号处理》讲稿第6章.ppt
第6章 语音合成 本章主要讨论的问题: 1.语音合成原理和方法 2.线性预测合成技术 3.语音音素合成技术 1.语音合成原理和方法 共振峰语音合成原理如下: ①浊音和清音分别采用不同的激励源。 ②发不同语音对应不同声道路径和滤波器。 ③发不同语音对应不同幅值控制和频率控制。 ④共振峰和基频是语音信号的2个主要特征。 Vortax公司推出的Computalker是一种典型的语音合成产品——最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。 共振峰模型分为级联型、并联型、混合型三类。 对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。 混合型共振峰语音合成模型 2.线性预测合成技术 线性预测技术有两个特点: a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。 b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。 2.线性预测合成技术 (1)线性预测原理 线性预测技术可以看成是一种曲线的拟合技术。 预测误差e(n)的表达式: e(n)= x(n)-x^(n) = x(n)-∑akx(n-k) 式中,x^(n)=∑akx(n-k)为预测值,ak为预测系数。 2.线性预测合成技术 将预测误差e(n)的表达式进行Z变换得: E(Z)=X(Z)(1-∑akZ-k) 由此,可得 X(Z)= E(Z)·[1/(1-∑akZ-k)] 此式即为语音的合成模型。 2.线性预测合成技术 对上式进一步化简,得: X(Z) = H(Z)I(Z) 其中,H(Z)=1/(1-∑akZ-k)为模拟声道滤波器传递函数。I(Z)为频谱分布为0dB/倍频程的脉冲激励源,即I(Z)=E(Z)。 上式表明:利用线性预测可以把模拟声道的滤波器和模拟声源的脉冲激励分离开来。均方误差最小时,浊音对应脉冲波激励,清音对应白噪声。 线性预测用于共振峰分析,如图所示。 线性预测用于共振峰分析 2.线性预测合成技术 线性预测编码(LPC)的关键问题是在均方误差最小条件下求出线性预测系数ak。此时,由x^(n)=∑akx(n-k)可近似地恢复x(n)。 目前,有3种求线性预测系数ak的方法:直接法、自相关法、协方差法。 2.线性预测合成技术 ①直接法 求解线性预测系数的直接法与求出曲线的拟合系数的方法相同。总的均方预测误差为: 2.线性预测合成技术 对M求偏导数,并使aj的偏导数为0,得: 2.线性预测合成技术 利用上式的p个线性联立方程,可求出p个线性预测系数a1,a2,…,ap。 这种求解方式在计算机上进行,很方便。n的求和范围一般为-∞n+∞。但考虑语音信号的特性,实际上,在一段时间求和(加窗函数?n),即 x(n)* = ?n·x(n) 窗函数的长度一般为100~250。 2.线性预测合成技术 ②自相关法 自相关法是上式的另一种解法。 设自相关函数为 2.线性预测合成技术 联立方程组可变换成: R(0)a1+R(1)a2+R(2)a3+…+R(p-1)ap =R(1) R(1)a1+R(0)a2+R(1)a3+…+R(p-2)ap =R(2) R(2)a1+R(1)a2+R(0)a3+…+R(p-3)ap =R(3) …… R(p-1)a1+R(p-2)a2+R(p-3)a3+…+R(0)ap =R(p) 这是一个系数对称的线性联立方程。Durbin和Levinson提出了求解这种特殊方程组的最佳解算法。 2.线性预测合成技术 ③协方差法 这种方法无需对语音信号加窗,它能精确算出预测系数,而在帧内的分析时间比自相关法要短。 这种方法假设n求和范围为定数N,起点在n=h处,计算样本数h到h+N-1时共N个样本值时的预测系数。此时,联立方程组可变换为: 2.线性预测合成技术 2.线性预测合成技术 因为Qhjk=Qhkj,可见上式是一个对角线对称的系数矩阵。矩阵Qh 是半正定,可近似地假设为正定。根据Cholesky定理,正定对称矩阵可进行如下分解: Q=LLT 其中,L为一个下三角阵,由此,可得一个有效的求解算法。 通常,用于计算预测系数的语音信号样本值在50~100之间,每隔100~250个样本值重新计算预测系数。 2.线性预测合成技术 (2)格型合成滤波器 根据以上3种方法,求得线性预测系
您可能关注的文档
- 软件开发过程的度量.pdf
- 策略性商务谈判技术78432.doc
- 动物游戏之谜25587.ppt
- 非招标采购管理实施细则.doc
- 第六章仓储成本管理.ppt
- 网络规划设计师2.ppt
- 成功一定有方法76956.doc
- 2初中英语写作技巧指导50206.ppt
- 专八人文知识概说.ppt
- 组织行为学261326.ppt
- (4篇)XX区抓党建促基层治理培训心得体会汇编12.docx
- 汇编1154期-在培训班上的讲话汇编(3篇).doc
- 汇编1173期-专题党课讲稿汇编(3篇)112.doc
- 汇编1076期-主题党课讲稿汇编(3篇).doc
- 汇编1177期-学习心得体会汇编(3篇)112.doc
- (6篇)党和国家机构改革心得体会汇编.docx
- 汇编1166期-坚定理想信念、全面从严治党、担当作为专题党课讲稿汇编(3篇)112.doc
- 汇编1174期-专题党课讲稿汇编(3篇)112.doc
- 教育13期-主题教育学习心得体会、研讨发言材料参考汇编(3篇).doc
- 汇编1458期-心得体会研讨发言提纲参考汇编(3篇)123.doc
最近下载
- 露天非煤矿山施工方案.docx VIP
- 标准图集-13G322-1-钢筋混凝土过梁 - 烧结普通砖、蕉压灰砂翩。蒸压粉煤灰砖砌体.pdf
- 危大工程-模板工程及支撑体系-安全管理措施.doc VIP
- 高中历史选择性必修3《文化交流与传播》教学设计(修订版).doc
- 废水处理可行性研究报告.docx VIP
- 统编人教部编版小学语文四年级下册语文第二单元测试卷A(附答案).docx VIP
- GB-55015 空气源热泵技术解读-2024制冷展.pdf
- 2025年郑州旅游职业学院单招职业技能测试题库必考题.docx VIP
- 基于PLC的教室照明自控系统设计.doc
- GB50175-2014 露天煤矿工程质量验收规范.docx
文档评论(0)