- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于语音合成方法的调查报告
摘要 :本文是一篇关于语音合成方法的调查报告, 在搜集整理大量相关文献的基础上, 简要
的总结了几种常用的语音合成方法, 讨论各种合成方法的原理及算法, 并简要分析各种合成方法的性能及适用场合。
关键词 :语音合成;种类;原理;算法;性能
正文
语音合成技术是利用电脑 , 按规定的程序和指令 , 人为产生语音的技术。 语音合成从技术方式讲可分为波形合成、参数分析合成以及规则合成等三种。
1、波形合成
波形合成法一般有两种形式。 一种是波形编码合成, 它类似于语音编码种的波形编解码
法,该方法直接把要合成的语音的发音波形进行存储或者进行波形编辑压缩后存储, 合成重
放时再解码输出, 称 PCM波形合成法。 另一种是波形编辑合成, 他把波形编辑技术用于语音合成,通过选取音库中采取自然语言的合成单元的波形,对这些波形进行编辑拼接后输出。
1.1 波形编码合成
基本原理 :波形编码合成方法以语句、短语、词或音节为合成单元,这些单元被分别
录音后直接进行数字编码,经适当的数据压缩,组成一个合成语音库。 重放时,根据待输出的信息,在语音库中取出相应单元的波形数据,串接或编辑在一起,经解码还原出语音。
性能分析 :波形编码语音合成技术用原始语音波形替代参数,而且这些语音波形取自自然语音的词或句子,它隐含了声调、重音、发音速度的细微特性,也叫录音编辑合成,合成单元越大,合成的自然度越好,其质量普遍高于参数合成。且系统结构简单,价格低廉。
但合成语音的数码率较大, 存储量也大, 因而合成词汇量有限。 通常只能合成有限词汇的语音段。目前用于自动报时、报站和报警等。
1.2 波形编辑合成
基本原理 :波形编辑合成方法将波形编辑技术用于语音合成,通过选取音库中采取自
然语言的合成单元的波形, 对这些波形进行编辑拼接后输出。 它采用语音编码技术, 存储适
当的语音基元。 合成时, 经解码、 波形编辑拼接、 平滑处理等输出所需的短语、 语句或段落。
算法简述 :80 年代末和提出基于时域波形修改的语音合成算法。 PSOLA就是基音同步叠
加,它把基音周期的完整性作为保证波形及频谱平滑连续的基本前提。 该算法按以下三步实
施:对原始波形进行分析,产生非参数的中间表示;对中间表示进行修改; 将修改过的中间
表示重新合成为语音信号。 由于修改的参数不同, 又分为 TD-PSOLA、FD-PSOLA和 LP-PSOLA。
PSOLA是用于波形编辑合成语音技术中对合成语音的韵律进行修改的一种算法。 下图是
利用 PSOLA算法的语音合成系统的基本结构:
图 1 基于 PSOLA算法的语音合成系统
本质上说, PSOLA算法是利用短时傅里叶变换重构信号的叠结相加法。 信号的 x(n) 短时
傅里叶变换为:
由于语音信号是一个短时平稳信号, 因此在时域每隔若干个 (例如 R 个)样本取一个频谱函数就可以重构信号 x(n) ,即可令:
其傅里叶逆变换为:
然后就可以通过叠加得到原信号,即:
时域基音同步叠加技术作为基音同步叠加技术的一种,通过以下步骤实现语音的合成:
对语音合成单元设置基音同步标记。
以语音合成单元的同步标记为中心,选择适当长度(一般取两倍的基音周期)的时窗对合成单元做加窗处理,获得一组短时信号。
在合成规则的指导下,调整步骤1)中获得的同步标记,产生新的基音同步标记。
根据步骤 3)得到的合成语音的同步标记,对步骤2)中得到的短时信号进行叠加,
从而获得合成语音。
性能分析 :PSOLA算法在编辑和拼接语音波形前能根据上下文的要求,
律特征作出调整, 而且音库中的采佯波形中保留了一部分原发音人的语音特征.
语音的自然度和清晰度都得到了显著提高。
对拼接单元的韵这样使台成
2、参数分析合成
参数分析合成多以音节、半音节或音素为合成单元。首先,按照语音理论,对所有合
成单元的语音进行分析, 提取有关语音参数, 这些参数经编码后组成一个合成语音库; 输出时,根据待合成的语音的信息, 从语音库中取出相应的合成参数, 经编辑和连接, 顺序送入语音合成器。在合成器中,通过合成参数的控制,将语音波形重新还原出来。
参数分析合成方法基于声道截面积函数或声道谐振特性合成语音,如共振峰合成、 LPC 合成。这类合成技术在的比特率低,音质适中。为改善音质,发展了混合编码技术,主要手
段是改善激励, 如码本激励、 多脉冲激励、 长时预测规则码激励等, 这样,比特率有所增大,同时音质得到提高。
参数分析合成的主要优点是数据量小,易于实现韵律修改,但有限的参数很难表述自然语音的细微变化。
共振峰合成
基本原理 :语音合成的理论基础是语音生成的数学模型。 该模型语音生成过程是在激励
信号的激励下,声波经谐振腔(声道),由嘴或鼻辐射声波。因此
原创力文档


文档评论(0)