- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ch8-语音合成.ppt
利用语音信号的生成模型,将声道视为一个谐振腔,利用腔体的谐振特性,共振峰频率及其带宽,为此构造一个共振峰滤波器。对激励信号进行处理,可到合成语音。 Av 冲激序列 发生器 声门脉冲 模型G z 随机噪声 发生器 基音周期TP AN 共振峰滤波器 清/浊音开关 二、共振峰合成方法 鼻腔 共振峰 滤波器 浊音激励 清音激励 第一 共振峰 滤波器 第二 共振峰 滤波器 第三 共振峰 滤波器 摩擦音 共振峰 滤波器 FV AH AF AN AV LF1 LF2 LF3 FF 可控制的参数共有10个: (1)4个幅值控制AV、AN、 AH、 AF (2)5个频率控制FV(浊音基频)、LF1、LF2、LF3、FF (3)1个清/浊音开关 §8.3 线性预测合成法 LPC编码 将语音生成模型简化,将辐射、声道和声门激励进行组合,用一个时变数字滤波器来表示。 冲激 序列 发生器 随机 噪声 发生器 x n u n 线性 预测 分析 基音频率 清/浊音判别 参数 合成 k2 kp 基音频率 输入语音x n 清/浊音标志 G k1 格型滤波器语音合成技术框图 合成 语音 §8.4 TTS合成技术 一、TTS合成技术的应用 二、TTS合成系统的构成 三、文本分析 四、韵律控制 五、语音合成方法 一、TTS合成技术的应用 1.可以用于各种智能系统,如信息查询系统、自动售票系统或残疾人的辅助交流工具。 2.可以用于通信设备或一些数字产品,这样传递的信息不是语音,而是文字,在通信设备的终端将文字信息转换为语音即可,由于每个文字占用两个字节,因而极具有价值 文本 文本分析 韵律控制 合成模块 语音数据库 输出 二、TTS系统的构成 对输入文本进行分析切割出字词以后,通过语音合成方法把这些字词的发音合成出来,并串接起来,通过韵律调整,就可以得到较为自然的语句的发音。 三.文本分析 主要功能是使计算机能够识别文字,并根据文本的上、下文关系在一定程度上对文本进行理解,将发音的方式告诉计算机;另外,还要让计算机知道文本中哪些是短语、句子,发音时到哪应该停顿,停顿多长等等。 1.文本分析的主要功能: * * * * * * * * 第八8章 语音合成(speech synthesis) 概述 共振峰合成法 线性预测合成法 TTS合成技术 概述 一、语音合成定义 二、语音合成技术的应用 三、语音合成的方法 一、语音合成定义 解决如何让机器象人说话的问题。其目的:能将任意文本实时地转换为自然语音输出,且输出的语音清晰可懂。 二、语音合成技术的应用 语音是信息传播的一大媒介。近年来,提供语音服务的语音系统迅速发展起来。传统的语音系统一般采用预录音回放技术,由于这种方法必须对信息文本事先进行录音,并存为声音文件,因此,所占用的存储空间很大。另外,一个更大的缺点是不能实时反映信息的更新,应用范围有很大的局限性。 录音 wav 回放 传统的语音系统 语音 压缩编码 输入语音 恢复语音 现在的语音合成技术,无需对大量的信息进行录音,极大地减少了工作量和节省了存储空间,尤其是在信息内容需要经常变动的动态查询场合,如股市行情查询、有声Email系统,都是传统的预录音技术无法代劳的。结合其他技术,语音合成技术可以广泛应用于金融、邮电、工商、 政府机关、交通、教育、游戏等领域。 几个语音合成技术的应用实例 1. 电话查询系统 工商信息电话查询系统、银行电话查询系统、股票查询系统、交通信息查询系统、考试成绩查询系统等。 2.教育与娱乐软件 普通话教学软件是帮助想学普通话的用户, 以往的普通话教学软件只是将预先录好音的单词逐个读给用户听,有了语音合成技术,可以将任意文本中的整句话、整段话读给用户听,学习效率明显提高。 现在计算机游戏中的人物,或者不会说话,或者只会“ 播放”已经录好的声音。利用语音合成, 游戏中的人物可以说出任意的话语,不同的人物可以通过选用不同的音库而形成不同的说话风格。增加了游戏的趣味性和互动性 游戏软件 1. 语音信号的波形合成(录音合成技术) 采用数字存储技术存储基本的语音信息。 在合成时采用恰当的技术手段挑选出所需的语音单元拼接起来,生成高自然度的语句,这就是波形拼接的语音合成方法。为了节省存储容量,在存入机器之前还可以对语音信号先进行数据压缩。 三、语音合成技术方法 录音 wav 回放 语音 压缩编码 直接录放流程 语音库 (语音单元) 语音的波形 编码 输入语音 挑选 组合 回放 合成语音 波形合成方法 2. 语音信号的参数合成 根据语音产生的数学模型,利用短时平稳性,提出每帧语音信号的参数,这些参数经编码后组成一个语音参数库。输出时,从语音参数库中取出相应的参数,利用语音产生的数学模型恢复语音。共振峰合
原创力文档


文档评论(0)