- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音合成课件剖析
语音合成 主要讨论的问题: 一、语音合成的历史概况 二、语音合成技术分类 三、语音合成系统的特性 四、语音合成器及其工作原理 五、语音合成面临的基本问题 一、语音合成的历史概况 1、18世纪:第一批有科学目的的合成器; 2、1937年,Dudley的VODER(Voice Demonstrator)开创了一个新时代; 3、1960年,G. Fant 教授著书“Acoustic Theory of Speech Production”,系统阐述了语音产生理论; 4、J. L. Flanagan的“Speech Analysis ,Synthesis and Perception”被誉为语音学“圣经”; 5、Dennis Klatt 在缺少理论模型时,收集许多经验数据并结合语音产生的过程,解决了语音合成问题; 6、70年代以后,伴随LSI、VLSI等技术而迅速发展; 7、言语合成已广泛应用于人-机对话中。 二、语音合成技术分类 1、语音的波形编码合成; 2、语音的参数式分析合成; 3、语音的规则合成; 4、文-语转换系统。 三、语音合成系统的特性 1、合成单元 2、合成参数 3、合成语音库 4、语音合成器 5、合成音质 四、语音合成器及其工作原理 1、共振峰语音合成原理如下: ①浊音和清音分别采用不同的激励源。 ②发不同语音对应不同声道路径和滤波器。 ③发不同语音对应不同幅值控制和频率控制。 ④共振峰和基频是语音信号的2个主要特征。 Vortax公司推出的Computalker是一种典型的语音合成产品——最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。 共振峰模型分为级联型、并联型、混合型三类。 对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。 混合型共振峰语音合成模型 2.线性预测合成技术 线性预测技术有两个特点: a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。 b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。 3.语音音素合成技术 (1)语音音素合成原理 语音音素合成(或称语音段合成)原理,有别于共振峰合成、线性预测合成。 它是基于语言发音的最小基本单位(音素)合成语音的方法。如同英语元音和辅音代码表、汉语拼音(或笔画)代码表一样,人们也将语音音素编制成一张代码表,称为“语音音素代码表”。通过对代码表中语音音素的不同组合,可合成单词或语句的发音。 3.语音音素合成技术 目前,Votrax公司的音素合成器产品占主导地位。Votrax音素合成器发音成功的编码关键——主要音素之间的转换使用了特殊的音素(不同持续间隔的等效音,同素异构音,静止等)。但是,它从文字到语音的转换规则很繁琐,音素转换规则也没有公开。 Votrax语音合成原理:每句英式英语经过一系列转换,成为Votrax音素表示,最后以ASCII字符代码,送入到合成器中进行语音合成。 3.语音音素合成技术 Votrax音素代码表由如下一系列表组成,主要包括: ①Votrax音素及其持续时间表。 ②Votrax音素的持续时间分级表。 ③Votrax音素的音高分级表。 ④Votrax音素的连接规则表。 ⑤Votrax音素分类表。 ⑥Votrax音素卡(表)。 ⑦相同国际音标的不同音素代码表。 3.语音音素合成技术 (2)语音音素合成器 目前,已出现不同型号的语音音素合成器和语音音素合成芯片。 Votrax公司的音素合成器产品占主导地位,其代表性的产品有: VS-K——价格低廉的语音音素合成器,主要适用于计算机业余爱好者。 VS-6——在VS-K基础上,加入4级音高控制,合成的语音质量有所提高。 Votrax ML-I型音素合成器。每个音素加入8级音高控制和4种持续时间,合成的语音质量进一步提高。 Votrax SC-01单片语音音素合成器。这是一种采用模拟开关电容滤波技术的LSI芯片。它可由输入的音素合成语音。利用这种芯片,已开发出实用的产品。 3.语音音素合成技术 (3)汉语的音素合成 汉语语音中,声母21个,韵母39个,汉语拼音可拼出416个汉字。若加上声调(四声),共有1664个不同音的汉字。 目前,还没有专门设计用于汉语音素合成的芯片。通常是用英语音素合成芯片来合成汉语。 3.语音音素合成技术 用英语音素合成芯片来合成汉语,需要解决如下几个问题: ①确定汉语与英语音素的对应关系。 ②注意整
您可能关注的文档
- 简历制作及面试技巧分解.ppt
- 语文七年级下沪教版4.5《竹石》课件1剖析.ppt
- 语文S版四年级下册第三课钓鱼剖析.ppt
- 语文三分钟演讲屠呦呦剖析.ppt
- 语文七年级下鲁教版6.2《登幽州台歌》课件4剖析.ppt
- 语文上午2016中招语文复习备考讲座简剖析.ppt
- 语文S版小学四下《古诗三首_江畔独步寻花》课件剖析.ppt
- 语文二年级下册词语剖析.doc
- 语文S版四年级下_6《桂林山水甲天下》剖析.ppt
- 语文五年级上人教新课标7.24《最后一分钟》课件2剖析.ppt
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
最近下载
- 西北工业(大学)数学分析历年考研试题.pdf
- 《Unit 4 Fun with numbers》教学设计外研版(三起)(2024)小学英语三年级上册.docx VIP
- 135战法55种方法图解(宁俊明版).docx VIP
- 小学生主题教育班会 不挑食我最棒 课件(共27张PPT).pptx VIP
- 工贸企业重大事故隐患判断标准解读培训课件.pdf
- 上海市2023年高考语文模拟题汇编-阅读与鉴赏(现代文阅读).doc
- 中国居民膳食指南2022全文.pdf
- 2024年《消费者权益保护法实施条例》全文解读PPT课件.pptx
- 商业商户店铺装修手册.doc
- 新人教版英语七年级上册全册课件(2024年新教材).pptx
文档评论(0)