第十五讲语音信号处理第8章.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.语音数据库 (2)声母表:22个声母的波形 (3)韵母表:38个韵母的波形(基音同步帧、过渡音和鼻音) (4)声调曲线:不同声调的声调曲线 。 (1)汉字拼音库: 每个汉字的拼音信息是一个二进制文件,其形式为:声母+韵母+声调标号。 4. 韵律控制 韵律特征包括声调、语气、停顿方式、发音长短等。这些通过基频、音长、音强等参数来体现,通过控制这些参数达到对韵律的控制。包括基音同步帧周期的调整、合成语音幅度的调整、声调曲线的修正等。 第8章 语音合成 8.1 概述 8.2 共振峰合成法 8.3 线性预测合成法 8.4 PSOLA算法合成语音8.5 TTS合成技术 8.1 概述 一、语音合成定义 二、语音合成技术的应用 三、语音合成的方法 四、语音合成系统介绍 一、语音合成定义 解决如何让机器像人说话的问题。其目的:能将任意文本实时地转换为自然语音输出,且输出的语音清晰可懂。 1. 电话查询系统 工商信息电话查询系统、银行电话查询系统、股票查询系统、交通信息查询系统、考试成绩查询系统等。 二、语音合成技术的应用 ? 2.教育与娱乐软件 普通话教学软件是帮助想学普通话的用户, 以往的普通话教学软件只是将预先录好音的单词逐个读给用户听,有了语音合成技术,可以将任意文本中的整句话、整段话读给用户听,学习效率明显提高。 3.游戏软件 现在计算机游戏中的人物,或者不会说话,或者只会“ 播放”已经录好的声音。利用语音合成,游戏中的人物可以说出任意的话语,不同的人物可以通过选用不同的音库而形成不同的说话风格。增加了游戏的趣味性和互动性。 1. 语音信号的波形合成(录音合成技术) 采用数字存储技术存储基本的语音信息。 在合成时采用恰当的技术手段挑选出所需的语音单元拼接起来,生成高自然度的语句,这就是波形拼接的语音合成方法。为了节省存储容量,在存入机器之前还可以对语音信号先进行数据压缩。 三、语音合成的方法 语音库 (语音单元) 语音的波形 编码 输入语音 挑选 组合 回放 合成语音 波形合成方法 2. 语音信号的参数合成 根据语音产生的数学模型,利用短时平稳性,提出每帧语音信号的参数,这些参数经编码后组成一个语音参数库。输出时,从语音参数库中取出相应的参数,利用语音产生的数学模型恢复语音。共振峰合成和线性预测合成是该类合成技术中的重要方法。 3. 语音信号的规则合成 将任意文本转换成声音的系统。包括语言学和声学处理。合成的词汇不是事先确定。常见的是文语转换合成技术 text-to-speech (TTS)。 系统中存储的是音素的声学参数,以及由音素组成音节、由音节组成词、由词组成句子的规则;控制音调、轻重音等韵律的各种规则。 给出待合成的字母或文字后,根据语义规则和语音规则,确定每个字的音素的组成和句子的低层结构。为每一个词、每一个音节确定重音等级和语句结构及语调,其中包括各种停顿等,这样文字串就变成了代码串。声学处理利用规则将代码串转换成连续语音波。 四、语音合成系统介绍 欢迎使用微软中国研究院中文语音合成系统 采用TTS技术合成语音 http://research. M/speech/tts 8.2 共振峰合成法 一、共振峰合成的原理 二、共振峰合成的方法 Av 冲激序列 发生器 声门脉冲 模型G(z) 随机噪声 发生器 基音周期TP AN 线性系统 声道V(z) 辐射 模型 R(z) 清/浊音开关 语音的生成模型 一、共振峰合成的原理 Av 冲激序列 发生器 声门脉冲 模型G(z) 随机噪声 发生器 基音周期TP AN 共振峰滤波器 清/浊音开关 利用语音信号的生成模型,将声道视为一个谐振腔,利用腔体的谐振特性,共振峰频率及其带宽,为此构造一个共振峰滤波器。对激励信号进行处理,可得到合成语音。 二、共振峰合成方法 共振峰合成器的系统模型 8.3 线性预测合成法 将语音生成模型简化,将辐射、声道和声门激励进行组合,用一个时变数字滤波器来表示。 冲激 序列 发生器 随机 噪声 发生器 x(n) u(n) 线性 预测 分析 基音频率 清/浊音判别 参数 合成 k2 kp 基音频率 输入语音x(n) 清/浊音标志 G k1 格型滤波器语音合成技术框图 合成 语音 反射系数 8.4 PSOLA算法合成语音 20世纪80年代末,由F.Charpentier和E.Moulines等提出的的基音同步叠加技术(PSOLA)和早期的波形编辑有原则性的差别,它既能保持原始语音的主要音段特征,又能在音节拼接时灵活调整其基音、能量和音长等韵律特征,因而很适合于汉语语音

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档