基于连续语音合成的高个性语音转换.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于连续语音合成的高个性语音转换

基于连续语音合成的高个性语音转换 摘要- (a)这个建议方法能够使发言者的个性特征转换得更好 (b)用人单位选择的框架特别是加入语音合成技术的成本关键词- 语音合成,加入成本,扬声器,单位选择,语音转换OICE转换是一种技术这项技术的一般分为两个阶段:培训阶段和转换阶段在阶段这已成为一种脱机处理 因为转换语音质量的退化文本到语音转换(TTS)是一种技术自动相应合成语音基于语料库的时域方法成为广泛用于实现高质量的语音合成[6]语音合成是一个语料库的语音合成[7] - [9]的方法。为了实现这些功能,在这个方法方面,合成语音是通过在一个大型的语音语料库中加入一个说话者的自然短期波形片段制成的。换句话说用这种方法生成的合成语音再造一个保护自然和最可取的波形段语料库搜查搜索是基于以下两种候选之间的标准和目标失真不连续的波形边界虽然这种方法很简单相对于其他传统语音合成,如LPC合成,计算量较大的存储空间和更广泛的方法是必要的然而一般来说 合成语音质量的程度可以有更大的语料库波形更合适的候选人和更精确的参数最近几年的研究高品质的语音合成可以通过使用超大语音语料库[9语音合成技术实现语音转换系统数据的大小比一般语音合成语料库小因此有人认为数据较少的情况下它变得难以作出准确的转换规则此外也很难实现高品质足够的转换分解和重新合成 采用常规方法作者还语音传统的转换改善这也意味着语音合成缺点丰富的计算机资源也就是说这些缺点限制了建议方法的应用领域不过这建议此外 特定的人的声音是非常宝贵的 例如著名的演员因此 作者认为,在这些情况下更多的优点 本文第二节和第三节描述了传统的语音转换和语音合成的概述。在第四节,根据语音转换单位语音合成技术的选择提出。约40分钟的致辞来评估和讨论这种建议的执行效果,最后。 语音转换概述 语音转换是指把一种声音转换成另一种声音的一种技术,就好像另一个人发出的声音。 斯蒂利亚努提出了使用高斯混合模型(GMM)[1统计语音转换方法。凯恩等,在语音合成应用程序数据库扩大[2]。户田等动态频率频在这些统计方法分解为光谱和韵律参数的帧这些参数根据光谱随机趋势被修改,然后再合成作为输出。这种方法是有效的,特别是在语音数据较少的情况下。 另一方面,也尝试市场为基础的方法。安倍等提出了一个方法,可以将目标语音音素分割的音素段在方法,来源和目标因为映射表提供源之间。每一部分被分解为LPC参数。转换过程如下。 1. 一个输入是音素阶段。 2. 通过源扬声器的语料库系统搜索,计算输入部分和本身。 3. 根据映射表,源扬声器的最佳部分被替换为目标。 4. 输出是重新目标的LPC参数。 这种方法可以保持段内每个环节自然语音的动态特性。安倍等比他们以前帧结果。此外,介绍评分可以作为语音合成单元选择的目标成本。 德曼等建议文本语音转换没有语言知识基础上]。这种技术开发语音转换语音。 一般来说,语音转换是小数据,因为大量语音数据的必要性限制其应用范围。然而,另一方面它难以作出足够准确转换规则,生成高质量的。也就是说,数据大小和转换质量。此外,过度分解和重新合成造成自然和个性。 语音质量影响,即在发言中从男转换为女性的比从男性转换为另一种男性,()在发言中从男转换为女性的声音质量从男性转换为另一种男性。 语音合成,是一个以语料库为基础的时域语音合成,采用了大量的计算而且积累了许多自然波形片段的大型语音语料库[7] - [9]。用这种方法合成的声音既高自然度而且高度个性化,因为涉及这些领域的个性包括自然语音波形的特点。处理流程如图1所示。 图1-语音合成的处理程序 文本信息,如发音和重音的信息是从输入文本中提取的文本分析的一部分。在目标功能的生成部分,合成了语音理想的韵律参数的文本信息。最可取的波形片段的序列是由相互连接的单元决定选择的。 单位选择的定义在语音语料库波形段建网络动态规划算法是对这个问题的典型解决方案之一两种成本介绍了每部分候选的排名 目标成本 如图所示 目标成本质量退化欧氏距离特征向量加入成本欧氏距离特征向量总成本的第i个候选单位,通过整合获得这两项费用不仅光谱特性和音素特征韵律特征合成语音最近几年的研究高自然合成语音语音合成技术超大语音语料库这种方法避免如LPC合成“分解和重新合成”的过程该系统用自然作出波形合成语音因此,这种方法还可以实现高性即使没有那么大这种做法的好处因为在每一个自然波形段保存CHATR情况用不到1小时的演仍有相当高的因此,有人认为语音合成实质语音转换框架个性在这个文件中 图2 单位语音合成技术的选择成本计算四语音转换的单元选择本节介绍了语音这项建议的程序,如图安倍等人的方法是这个建议的框架他们的主要区别如下(1) “LPC分解和重新合成”的过程中没有采用这项建议的方法该

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档