- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第7章声音合成与转换
7.1语音合成方法7.2汉语基于音节的规则合成方法7.3语音转换方法7.4语音转换评价指标7.5.语音转换应用案例7.6非平行语音转换应用案例
27.0语音合成系统整体框图
37.1.1参数合成方法7.1.2波形合成方法7.1语音合成方法
47.1语音合成方法 语音合成是一个基于分析、存储、合成过程的技术。一般而言,合成的过程包括以下步骤: 首先,选择适当的基本声音单位,然后以一定的参数编码或波形编码方式存储这些单位,从而构建一个语音库。在合成阶段,根据待合成的文本信息,从语音库中提取相应的基本单位进行拼接,最终将它们还原为语音信号。在语音合成中,为了实现存储,必须首先对语音信号进行分析或转换,因此在合成之前通常需要进行相应的反变换。
57.1语音合成方法 语音库是合成的基本元素集合,包含了所有合成基本单位。根据不同的基本单位选择方式和存储形式,语音合成方法可以被概括为波形合成方法和参数合成方法。
6参数合成方法:参数合成,又称分析-合成,采用了声码器技术以实现存储空间的高效利用。其核心思想是在合成过程中通过声音分析,提取关键语音参数,从而将语音信号进行高度压缩。7.1.1参数合成方法最常用的参数提取方法包括线性预测编码(LPC)、线性谱对(LSP)系数以及偏自相关(PARCOR)系数。
77.1.1参数合成方法一般来说,参数合成方法可以根据声道特性的不同描述方式分为线性预测合成方法和共振峰合成方法。这些方法在选择参数和声道建模方面存在差异,因此会对合成语音的质量和清晰度产生影响。
87.1.1参数合成方法线性预测合成方法 线性预测合成(LPC)是一种广泛应用的语音合成方法,它基于全极点声道模型的假设,并采用线性预测分析原理来合成语音信号,通过具体的线性预测编码(LPC)参数来控制声道特性。 LPC能够提取语音信号的全部谱特性,包括共振峰的频率、带宽和幅度等。此外,LPC将音高和振幅特性的激励源与控制音素的声道滤波器相分离。
9一般线性预测合成系统中不允许使用混合激励形式,清音激励全部采用白噪声序列,可以通过改变浊音激励来提高合成语音的质量。合成语音样本为:7.1.1参数合成方法
107.1.1参数合成方法?
117.1.1参数合成方法LPC递归型合成滤波器
127.1.1参数合成方法LPC格型合成滤波器?
13缺点:根据语音信号产生机制,许多语音信号,尤其是清音和鼻音,其声道响应包含零点的影响。因此,从理论上讲,应该使用零极点模型而不是简单的全极点模型。此外,由于LPC谱估计的效果与声音的谐波结构密切相关,对于音调较高的女声信号,其频谱中的谐波成分间距要比男声信号大得多,因此反映出的声道谐振特性不如男声信号那么尖锐。因此,在用LPC谱逼近女声信号谱的共振特性时,误差明显大于男声信号,而儿童声音的效果更差。7.1.1参数合成方法
147.1.1参数合成方法
157.1.1参数合成方法2.共振峰合成方法 语音感知的核心因素是声道共振峰,不同语音具有不同的共振峰模式。这些共振峰以及其带宽参数可以用于构建共振峰滤波器。通过组合多个这种滤波器以模拟声道的传输特性,并对来自激励声源的信号进行调制,然后通过辐射即可获得合成语音。这就是共振峰语音合成器的基本原理。
167.1.1参数合成方法共振峰合成系统
177.1.1参数合成方法
187.1.2波形合成方法波形合成方法:波形合成方法是一种相对简单的语音合成技术。它直接存储人类语音的波形或经过简单的波形编码后存储,形成语音库。 在合成时,根据待合成信息,从语音库中提取相应单位的波形数据,拼接或编辑它们,然后解码以还原为语音。在波形合成系统中,语音合成器的主要任务是存储和回放语音。。
19在20世纪80年代末,F.CharPentier等人提出了基音同步叠加技术(PSOLA),这一技术在波形拼接中保持了原始发音的主要音段特征,并在拼接时能够调节音高和音长等韵律特征,为波形拼接技术带来了新的发展。7.1.2波形合成方法PSOLA算法是波形拼接技术的一种,其主要特点是在进行语音波形片断拼接之前,根据语义信息,调整拼接单元的韵律特征,以使合成波形既保留原始语音基元的主要音段特征,又使拼接单元的韵律特征与语义相符。
20由于韵律修改所针对的侧面不同,PSOLA算法可以有TD(timedomain)-PSOLA和FD(frequencydomain)-PSOLA等几种不同的算法。不论哪一种类型的PSOLA算法,一般都按着以下三个步骤实施:(1)基音同步叠加分析:对原始语音信号做准确的基音同步标注,将原始语音信
文档评论(0)