- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于波形拼接的语音合成
维吾尔语音合成技术研究报告 维吾尔语的特点 维吾尔语属于阿尔泰语系,她有标准语和方言。我们讨论的是维吾尔标准语,现行维吾尔文字释义阿拉伯文字为基础的,共有32个字母。 (1)维吾尔语的音素结构 音素是最小的语音单位,它有元音和辅音两大类。在32个字母中有8个元音字母,24个辅音字母。 维吾尔语字母表及其读音表示 维吾尔语字母表及其读音表示 (2)维吾尔语的音节结构 维吾尔语音节的三大块是:(起音)+领音+(收音)。领音必须是元音,音节中可以没有起音和收音,但是不能没有领音,所以元音是音节的中心。我们用字母‘V’表示元音,用‘C’表示辅音,维吾尔语的音节可以归纳为以下几种形式: V,VC,CV,VCC,CVC,CVCC,CCV,CCVC,CCVCC. 维吾尔语中约有5000多个音节,(包括外来词)但是这些音节的使用频率是不平衡的。一般有2000个左右的常用音节。 (3)维吾尔语词语构成 维吾尔语中有着丰富的构词词缀,而且词缀在词的构成中具有不同的作用。 第一类是用来生成新词的词缀; 第二类词缀是构成名词复数形式的词缀; 第三类词缀是用来构成名词所有格; 第四类词缀是用来构成形容词的级别。 统计上述的词缀共有263个。这些词缀都是由一个或者多个音节构成的。 在维吾尔语里,表示同一语法意义的词缀往往有几种语音上有差别的形式,它们叫做变体。如-???/-???都表示复数,只是在语音上有差别。在说话时变体中选择何种形式,取决于语音和谐规律。 (4)维吾尔语句子的构成 同其它语言的句子一样,由词、短语构成。但是维语句子中的词语和词语之间用空格分开,发音和文字表示是一致的,这就为我们的文本分析提供了方便。 近期语音合成的方法可以归结为四种: 1、物理机理语音合成; 2、源-滤波器语音合成; 3、基于波形拼接技术的语音合成; 4、可训练的语音合成; 基于波形拼接的语音合成 波形拼接合成方法的基本原理就是根据输入文本分析得到的信息,从预先录制和标注好的语音库中挑选合适的单元,进行少量的调整,然后拼接得到最终的合成语音,其中用来进行单元挑选的信息可以是前端分析得到的韵律文本,也可以是生成的声学参数(比如基频、时长和谱参数),或者两者兼有。 由于最终合成语音中的单元都是直接从音库中复制过来的,其最大的优势就是在于保持了原始发音人的音质。 基于波形拼接的语音合成 其中基于波形拼接技术的合成包括: 1、基于大语料库的波形拼接合成方法。 由于在模型的精确度方面的原因,以前的合成器都难以有效的合成高自然度的语音,而基于原始语音库的波形拼接合成在实现高自然度的合成系统上,取得了很大的进展。 2、基于小样本的波形拼接调整合成。 基于大语料库的波形拼接合成 虽然大语料库合成系统的合成语音的音质和自然度都相当不错,相应的单元挑选策略也越来越精细,使得挑选出来的单元基本不需要调整,不仅保持了原始语音的音质,而且不连续现象也得到很大的改善,自然度得到极大的提高并得到了越来越广泛的应用,但是它也存在一些内在的缺陷和不足。 一般而言,大语料库合成系统的合成效果都不是很稳定,对有些语句可以合成的很好,而对有些语句则合成效果比较差。 由于音库很大,使得音库制作的工作量非常大,而且周期也很长,合成系统的合成语音比较单一。 基于小样本的维吾尔波形拼接合成 为了利用容量最小的语音语料库来高自然度地合成所有维吾尔文本,我们选择了原始音库比较小(即拼接样本数比较少)的合成系统也就是基于小样本的波形拼接合成系统,研究一些调整算法来对时长、基频以及谱参数进行高灵活度的调整并平滑拼接点处从而提高合成语音的自然度。对此我们做了一些研究工作。 基于单音素的语音合成 我们实现了两种不同拼接单元的语音合成技术: 1、基于单音素的语音合成技术: 单音素语音语料库是由32个维吾尔音素组成的一个声音文件其中有8个元音和24个辅音。 我们首先研究维吾尔语的特点,积累了维吾尔里面常用的,用得最频繁的特定的单词,然后考虑音素的拼接问题,比较录制的各种音素声音,取出发音最清楚的维吾尔音素就建立了单音素语音语料库。 系统收到维吾尔文本后,文本分析模块分析收到的文本并把它分割成音素序列,取出语料库中对应的语音数据来合成语音。
您可能关注的文档
最近下载
- 最新:房颤诊断和治疗中国指南2023 .pdf VIP
- 食品生物技术概论 教学课件 作者 廖威 主编 谭强 主审 第十章 生物技术在食品水平分析检测.ppt VIP
- 1.坚守初心主题高分作文《我也是个取水人》读写拆解-备战2025年中考语文写作四步拆解高分作文(全国通用).docx VIP
- AQT2033-2023 金属非金属地下矿山紧急避险系统建设规范.pdf VIP
- 中级职称评审-人工智能工程-专业技术报告.docx VIP
- 16MG04 钢筋混凝土过梁.docx VIP
- 食品生物技术概论(廖威)第六章 蛋白质工程在食品工业中的应用.ppt VIP
- 中小学口风琴课程教学计划.docx VIP
- 第4课 运动负荷的监控+课件+ 2025-2026学年人教版(2024)初中体育与健康八年级全一册.pptx VIP
- 利用人工智能助力高质量数学教学——以“因式分解平方差公式”一课教学为例.pdf VIP
文档评论(0)