语音合成讲课.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音合成 主要讨论的问题: 一、语音合成的历史概况 二、语音合成技术分类 三、语音合成系统的特性 四、语音合成器及其工作原理 五、语音合成面临的基本问题 一、语音合成的历史概况 1、18世纪:第一批有科学目的的合成器; 2、1937年,Dudley的VODER(Voice Demonstrator)开创了一个新时代; 3、1960年,G. Fant 教授著书“Acoustic Theory of Speech Production”,系统阐述了语音产生理论; 4、J. L. Flanagan的“Speech Analysis ,Synthesis and Perception”被誉为语音学“圣经”; 5、Dennis Klatt 在缺少理论模型时,收集许多经验数据并结合语音产生的过程,解决了语音合成问题; 6、70年代以后,伴随LSI、VLSI等技术而迅速发展; 7、言语合成已广泛应用于人-机对话中。 二、语音合成技术分类 1、语音的波形编码合成; 2、语音的参数式分析合成; 3、语音的规则合成; 4、文-语转换系统。 三、语音合成系统的特性 1、合成单元 2、合成参数 3、合成语音库 4、语音合成器 5、合成音质 四、语音合成器及其工作原理 1、共振峰语音合成原理如下: ①浊音和清音分别采用不同的激励源。 ②发不同语音对应不同声道路径和滤波器。 ③发不同语音对应不同幅值控制和频率控制。 ④共振峰和基频是语音信号的2个主要特征。 Vortax公司推出的Computalker是一种典型的语音合成产品——最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。 共振峰模型分为级联型、并联型、混合型三类。 对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。 混合型共振峰语音合成模型 2.线性预测合成技术 线性预测技术有两个特点: a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。 b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。 3.语音音素合成技术 (1)语音音素合成原理 语音音素合成(或称语音段合成)原理,有别于共振峰合成、线性预测合成。 它是基于语言发音的最小基本单位(音素)合成语音的方法。如同英语元音和辅音代码表、汉语拼音(或笔画)代码表一样,人们也将语音音素编制成一张代码表,称为“语音音素代码表”。通过对代码表中语音音素的不同组合,可合成单词或语句的发音。 3.语音音素合成技术 目前,Votrax公司的音素合成器产品占主导地位。Votrax音素合成器发音成功的编码关键——主要音素之间的转换使用了特殊的音素(不同持续间隔的等效音,同素异构音,静止等)。但是,它从文字到语音的转换规则很繁琐,音素转换规则也没有公开。 Votrax语音合成原理:每句英式英语经过一系列转换,成为Votrax音素表示,最后以ASCII字符代码,送入到合成器中进行语音合成。 3.语音音素合成技术 Votrax音素代码表由如下一系列表组成,主要包括: ①Votrax音素及其持续时间表。 ②Votrax音素的持续时间分级表。 ③Votrax音素的音高分级表。 ④Votrax音素的连接规则表。 ⑤Votrax音素分类表。 ⑥Votrax音素卡(表)。 ⑦相同国际音标的不同音素代码表。 3.语音音素合成技术 (2)语音音素合成器 目前,已出现不同型号的语音音素合成器和语音音素合成芯片。 Votrax公司的音素合成器产品占主导地位,其代表性的产品有: VS-K——价格低廉的语音音素合成器,主要适用于计算机业余爱好者。 VS-6——在VS-K基础上,加入4级音高控制,合成的语音质量有所提高。 Votrax ML-I型音素合成器。每个音素加入8级音高控制和4种持续时间,合成的语音质量进一步提高。 Votrax SC-01单片语音音素合成器。这是一种采用模拟开关电容滤波技术的LSI芯片。它可由输入的音素合成语音。利用这种芯片,已开发出实用的产品。 3.语音音素合成技术 (3)汉语的音素合成 汉语语音中,声母21个,韵母39个,汉语拼音可拼出416个汉字。若加上声调(四声),共有1664个不同音的汉字。 目前,还没有专门设计用于汉语音素合成的芯片。通常是用英语音素合成芯片来合成汉语。 3.语音音素合成技术 用英语音素合成芯片来合成汉语,需要解决如下几个问题: ①确定汉语与英语音素的对应关系。 ②注意整

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档