- 1、本文档共103页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘 要
本文的研究工作致力于探索一种供参数合成法使用的,能够提供接近自然语
言的汉语单音节、两音节组和三音节组的基频曲线建模方法。基于863语音合成
语料库,主要研究了汉语单音节、两音节组和三音节组中辅音音段清浊特性和声
调间的搭配对超音段特征FO的影响及其表现形式,并建立了汉语单音节、两音
节组和三音节组基频曲线的产生模型。同时,针对大量语料的基频数据获取和基
频曲线动态表示两大难点,提出了一种检测基音的加权求和算法和一种基频曲线
动态变化的描述方法。
本研究的主要成果和创新工作如下:
1.提出了一种基于多尺度边缘特征提取的基音检测算法 (加权求和算法)。
通过提取三个尺度空间小波变换系数加权和的局部极值点,该算法能够获得突变
点的准确位置。这样以来,降低了因大尺度滤波器的平滑作用引起的漏警率和虚
警率,提高了检测精度,同时还提高了突变点与伪突变点之间的幅度差,具有很
好的抗噪性。
2提出了一种基频曲线动态变化的描述方法。通过判断基频曲线微分表达式
有效零点的个数及位置,该方法可对基频曲线进行 自动分段。每段基频 曲线只用
一个直角三角形来表示,而每个直角三角形的参数只有两个 (时长和斜率)。在
这种基频曲线分段模型中,时长和斜率两个参数都具有明确的物理意义,能够方
便清晰地描述基频曲线的走向。
3用真实语料的基频曲线建立了单音节基频曲线模型库。研究发现辅音音段
不同的清浊特性对相同声调的单音节基频曲线变化有显著的区别性影响:对于大
部分以浊声母开头的单音节阴平和去声而言,其基频曲线通常以上升开始;而对
于大部分以清声母开头的单音节阴平和去声而言,其基频曲线通常却以下降开
始;而且,比较以浊声母开头和以清声母开头的阳平和上声,发现它们基频曲线
起始部分的变化也存在明显不同。根据上述特征,建立了8类单音节基频曲线的
产生模型。汉语单音节的听测试验结果表明,与基于公式计算的方法相比,本方
法的单音节声调正确识别率提高了巧个百分点。
汉语单音节、两音节组和三音节组基频曲线建模方法研究
4.用真实语料的基频曲线建立了汉语两音节组基频曲线模型库。根据两音节
组的声调搭配、末字辅音音段的清浊特性对两音节组基频曲线影响的研究结果,
建立了32类两音节组基频曲线的产生模型.该模型库中的基频曲线全部选自863
语音合成语料库。这样,在基频曲线的生成过程中无需考虑内部基频曲线的走向
和音节间的过渡,保证了两音节组内部每个音节的基频曲线和音节间的过渡都平
滑自然。汉语两音节组的听测试验结果表明,与基于公式计算的方法相比,本方
法的两音节组声调正确识别率提高了6个百分点。
5.用真实语料的基频曲线建立了汉语三音节组基频曲线模型库.研究表明,
可以根据三音节组不同的声调组合、中字和末字辅音音段的清浊特性对三音节组
基频曲线分类。我们把每种声调组合的基频曲线分为4类,三音节组基频曲线的
变化模式共分为256类。同时,从863语音合成语料库中选择能代表三音节组基
频曲线典型变化的真实基频曲线建模。汉语三音节组的听测试验结果表明,与基
于公式计算的方法相比,本方法的三音节组声调的正确识别率提高了4个百分点,
音节之间的过渡平滑,整个组合的声调接近 自然语音。
汉语单音节、两音节组、三音节组听测试验的综合结果表明:与基于公式计
算的基频曲线相比,采用本方法的合成语音的自然度提高了0.6分,哒到5级
MOs得分的3.8分,接近良的标准;音节清晰度提高了3.47%,音节的正确识
别率达82.88%.
关键词:语音合成,基音检测,韵律模型
摘要
ABSTRACT
XiangchunLi (SignalandInformationProcessing)
DirectedbyProfLiminDu
ThisthesismainlyaimstobuildaFOcontourmodalforparametersynthesisof
Mandari
文档评论(0)