汉藏双语跨语言统计参数语音合成的研究-电路与系统专业论文.docxVIP

汉藏双语跨语言统计参数语音合成的研究-电路与系统专业论文.docx

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 西北 西北师范大学硕士学位论文 摘 要 近年来,多语种语音信息处理成为了智能语音信息处理中的重要研究方向。其中, 由于跨语言的语音合成能够利用同一个语音合成系统合成出不同语言的语音,成为了目 前的研究热点。中国是一个少数民族语言和方言众多的国家,跨语言语音合成技术的研 究对促进方言和民族语言语音技术的发展有着重要的意义。但是,目前国内外的研究中, 并没有一个完整的普通话/民族语言或普通话/方言的多语种语音合成系统。本文选取了 汉语普通话和藏语拉萨方言作为研究对象,研究了两种语言在发音上的特点及共性,设 计了普通话和藏语通用的标音方案、语音基元的语境信息标注格式以及对声学模型进行 决策树聚类的问题集。在此基础上,利用一个多说话人的普通话语料库和一个单说话人 的藏语拉萨方言语料库,将说话人自适应训练引入基于隐 Markov 模型(Hidden Markov Model, HMM)的语音合成方法中,训练获得了一个混合语言的平均音模型;之后,再利 用待合成藏语或汉语的少量训练语句,采用说话人自适应变换算法获得藏语或者普通话 的说话人相关模型,最终合成出藏语或汉语语音,实现了汉藏双语跨语言语音合成系统。 论文的主要工作和创新如下: 1.设计了一套面向统计参数语音合成的藏汉双语的机读音标方案。从声母、韵母和 声调等方面对藏语和汉语的发音特点做了对比研究,找出了两者在发音上的共性,利用 国际通用的机读音标,设计了一套汉藏双语的机读音标,实现了文本到字音的转换。 2.设计了一套面向统计参数语音合成的汉藏双语的上下文相关的标注格式。标注格 式包括声韵母层、音节层、词层、韵律词层、韵律短语层和语句层 6 层,用来标注藏语 或者汉语语句中的每个声韵母的语境信息。同时,设计了涵盖两种语言语音特色的决策 树问题集,用于声学模型的训练过程中对模型的聚类。 3.提出了一种利用说话人自适应训练实现汉藏双语跨语言语音合成的方法。利用一 个多说话人的普通话语料和一个单说话人的藏语语料,在 HMM 模型的训练中引入说话人 自适应训练,得到一个语言无关的平均音模型;然后采用 1 个藏语说话人的训练语料或 者 1 个普通话说话人的训练语料,采用说话人自适应训练获得该语言的说话人相关模型, 从而利用同一个系统合成出藏语语音或普通话语音。 4.实现了一个汉藏双语跨语言语音合成系统,评测了系统合成语音的音质。主观评 测和客观评测结果表明,在藏语训练集较少的情况下,本文提出的方法合成的藏语语音 的语音质量高于传统的方法。 关键词:多语种语音合成;汉藏双语语音合成;藏语语音合成;说话人自适应训练; 隐马尔科夫模型 I Abstract In recent years, Multilingual Speech Processing has become an important research direction of intelligent speech information processing, we can use cross- lingual Speech Synthesis technology to synthesis speech of different languages by a same system. China is a multi-ethnic country with different minority languages and dialects. Therefore the research on cross-lingual speech synthesis has important significance to promote the development of speech processing technology. However, there is no a complete speech synthesis system to synthesis the language of mandarin/minority or mandarin/dialect. Aimed at above situation, the thesis selects Mandarin and Tibetan Lhasa dialect to study the characteristics and similarities of their pronunciation. A set of phonetic alphabet is designed to label their initials and finals, a set of context-dependent label format is designed t

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档