第十五讲语音信号处理第8章.ppt

下载文档 降价啦

3
0
约3.25千字
约 32页
2017-06-30 发布于湖北
举报
版权申诉
保障服务

第十五讲语音信号处理第8章.ppt

1、本文档共32页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

3.语音数据库 (2)声母表：22个声母的波形 (3)韵母表：38个韵母的波形（基音同步帧、过渡音和鼻音） (4)声调曲线：不同声调的声调曲线。 (1)汉字拼音库：每个汉字的拼音信息是一个二进制文件，其形式为：声母＋韵母＋声调标号。 4. 韵律控制韵律特征包括声调、语气、停顿方式、发音长短等。这些通过基频、音长、音强等参数来体现，通过控制这些参数达到对韵律的控制。包括基音同步帧周期的调整、合成语音幅度的调整、声调曲线的修正等。第8章语音合成 8.1 概述 8.2 共振峰合成法 8.3 线性预测合成法 8.4 PSOLA算法合成语音8.5 TTS合成技术 8.1 概述一、语音合成定义二、语音合成技术的应用三、语音合成的方法四、语音合成系统介绍一、语音合成定义解决如何让机器像人说话的问题。其目的：能将任意文本实时地转换为自然语音输出，且输出的语音清晰可懂。 1. 电话查询系统工商信息电话查询系统、银行电话查询系统、股票查询系统、交通信息查询系统、考试成绩查询系统等。二、语音合成技术的应用 ? 2.教育与娱乐软件普通话教学软件是帮助想学普通话的用户, 以往的普通话教学软件只是将预先录好音的单词逐个读给用户听，有了语音合成技术，可以将任意文本中的整句话、整段话读给用户听，学习效率明显提高。 3.游戏软件现在计算机游戏中的人物，或者不会说话，或者只会“ 播放”已经录好的声音。利用语音合成，游戏中的人物可以说出任意的话语，不同的人物可以通过选用不同的音库而形成不同的说话风格。增加了游戏的趣味性和互动性。 1. 语音信号的波形合成（录音合成技术）采用数字存储技术存储基本的语音信息。在合成时采用恰当的技术手段挑选出所需的语音单元拼接起来，生成高自然度的语句，这就是波形拼接的语音合成方法。为了节省存储容量，在存入机器之前还可以对语音信号先进行数据压缩。三、语音合成的方法语音库（语音单元）语音的波形编码输入语音挑选组合回放合成语音波形合成方法 2. 语音信号的参数合成根据语音产生的数学模型，利用短时平稳性，提出每帧语音信号的参数，这些参数经编码后组成一个语音参数库。输出时，从语音参数库中取出相应的参数，利用语音产生的数学模型恢复语音。共振峰合成和线性预测合成是该类合成技术中的重要方法。 3. 语音信号的规则合成将任意文本转换成声音的系统。包括语言学和声学处理。合成的词汇不是事先确定。常见的是文语转换合成技术 text-to-speech (TTS)。系统中存储的是音素的声学参数，以及由音素组成音节、由音节组成词、由词组成句子的规则；控制音调、轻重音等韵律的各种规则。给出待合成的字母或文字后，根据语义规则和语音规则，确定每个字的音素的组成和句子的低层结构。为每一个词、每一个音节确定重音等级和语句结构及语调，其中包括各种停顿等，这样文字串就变成了代码串。声学处理利用规则将代码串转换成连续语音波。四、语音合成系统介绍欢迎使用微软中国研究院中文语音合成系统采用TTS技术合成语音 http://research. M/speech/tts 8.2 共振峰合成法一、共振峰合成的原理二、共振峰合成的方法 Av 冲激序列发生器声门脉冲模型G(z) 随机噪声发生器基音周期TP AN 线性系统声道V(z) 辐射模型 R(z) 清/浊音开关语音的生成模型一、共振峰合成的原理 Av 冲激序列发生器声门脉冲模型G(z) 随机噪声发生器基音周期TP AN 共振峰滤波器清/浊音开关利用语音信号的生成模型，将声道视为一个谐振腔，利用腔体的谐振特性，共振峰频率及其带宽，为此构造一个共振峰滤波器。对激励信号进行处理，可得到合成语音。二、共振峰合成方法共振峰合成器的系统模型 8.3 线性预测合成法将语音生成模型简化，将辐射、声道和声门激励进行组合，用一个时变数字滤波器来表示。冲激序列发生器随机噪声发生器 x(n) u(n) 线性预测分析基音频率清/浊音判别参数合成 k2 kp 基音频率输入语音x(n) 清/浊音标志 G k1 格型滤波器语音合成技术框图合成语音反射系数 8.4 PSOLA算法合成语音 20世纪80年代末，由F.Charpentier和E.Moulines等提出的的基音同步叠加技术（PSOLA）和早期的波形编辑有原则性的差别，它既能保持原始语音的主要音段特征，又能在音节拼接时灵活调整其基音、能量和音长等韵律特征，因而很适合于汉语语音