兰银官话统计参数语音合成的研究-电子与通信工程专业论文.docxVIP

兰银官话统计参数语音合成的研究-电子与通信工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 郑 重 声 明 本人的学位论文是在导师指导下独立撰写并完成的,学位论文没有剽 窃、抄袭、造假等违反学术道德、学术规范和侵权行为,否则,本人愿意 承担由此而产生的法律责任和法律后果,特此郑重声明。 学位论文作者(签名): 年 月 日 学位论文使用授权书 本论文作者完全了解学校关于保存、使用学位论文的管理办法及规定,即学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,接 受社会监督。本人授权西北师范大学可以将本学位论文的全部或部分内容编入学校有关 数据库和收录到《中国博士学位论文全文数据库》进行信息服务,也可以采用影印、缩 印或扫描等复制手段保存或汇编本学位论文。 本论文提交□当年/□一年/□两年/□三年以后,同意发布。 若不选填则视为一年以后同意发布。 注:保密学位论文,在解密后适用于本授权书。 作者签名: 导师签名: 年 月 日 西北师范大学研究生学位论文作者信息 论文题目 兰银官话统计参数语音合成的研究 姓 名 何洁 学 号 2012221377 专业名称 电子与通信工程 答辩日期 2014.6.2 联系电话E_mail 281276370@ 通信地址(邮编): 备注: 西北师范大学硕士学位论文 摘 要 日常生活中,语音是人们互相交流的最为方便快捷的方式,人们在交流的过程中, 夹杂着各色各样的方言。混合语言语音合成技术能够合成同一说话人说不同语言的语 音,是多语种语音处理的一个重要研究内容。现有的研究缺乏面向汉语普通话和方言的 混合语言语音合成的研究。针对此不足,本文以普通话和甘肃省的兰银官话方言为目标, 建立了语言独立声学模型,设计了兰州方言文本语料,实现了兰州方言从文本到语音的 转变,在此基础上,合成了兰州方言与普通话混合语音的 SAT 模型。论文的主要工作和 创新如下: 1.分析了兰州方言发音特点。对比普通话,分别对兰州方言的声母和韵母及其声调 规律进行了归纳总结。结合《方言调查字表》设计了 1000 个语句的文本语料库。录制 了兰州方言与普通话的语音语料。语料库既能用于兰州方言的实验语音学研究,也能用 于兰州方言的言语工程研究。 2.设计了一种兰州方言的机读音标 SAMPA-LZ 标注方案,以声韵母为基元,采用包 括方言声母、韵母和静音的韵律信息,提出了一种面向兰州方言机读音标 SAMPA-LZ 的字音转换算法,实现了兰州方言文本语料的 SAMPA-LZ 自动标注。 3.合成了普通话与兰州方言的混合语音。根据兰州话的发音特点,标注了语料的上 下文相关信息,设计了上下文相关的标注格式,在普通话决策树聚类的基础上,添加了 用于兰州话决策树聚类的问题集,并且计算了语音数据的广义梅尔倒谱系数。将声母和 韵母作为基元,采用基于隐马尔可夫模型(Hidden Markov Model, HMM)的统计参数语音 合成技术,利用兰州方言和普通话两种训练语音语料,实现了说话人相关模型和说话人 自适应模型的语音合成,并对普通话中混入兰州方言训练语料的两种合成结果进行了对 比评测。结果显示说话人自适应模型的合成语音整体上优于说话人相关模型的语音。 关键词:兰银官话;语音;混合语音合成;隐马尔可夫;自适应 I 兰银官话统计参数语音合成的研究 Abstract In our everyday life, voice is the most convenient way when people interact with each other. There are a great variety of dialects mixed in the process of communication. The mixed-language speech synthesis technology can synthesize the voices the same speaker say in different languages and it is also an important research on multi-lingual speech processing. The existing researches are lack of studies of mixed-language speech synthesis oriented to Mandarin and dialects. To meet this deficiency, with the goal of Mandarin and Lan-yin dialect in Gansu Province, the language-independent acoustic models are est

您可能关注的文档

文档评论(0)

jianzhongdahong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档