基于激励源及其韵律特征的源—目标说话人声音转换研究-research on source-target speakers voice conversion based on excitation source and prosodic characteristics.docx

下载文档 降价啦

8
0
约5.39万字
约 113页
2018-06-05 发布于上海
举报
版权申诉
保障服务

基于激励源及其韵律特征的源—目标说话人声音转换研究-research on source-target speakers voice conversion based on excitation source and prosodic characteristics.docx

1、本文档共113页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于激励源及其韵律特征的源—目标说话人声音转换研究-research on source-target speakers voice conversion based on excitation source and prosodic characteristics

中国科学技术大学博士论文目录，参考文献……，攻读学位期间论文发表情况…………致谢……中国科学技术大学博士论文摘要摘要，在不改变说话内容的前提下实现源说话人声音向特定说话人声音的转换，，。，其研究是在说话人识别和语音合成的研究基础上进行的同时也是这两个领域的，丰富和延拓具有非常广阔的应用前景和理论研究价值目前声音转换的研究，。大多集中在声道谱参数的转换上对于影响语音音色和听感的激励源及其韵律特，，征由于提取和建立数学模型的困难其研究较少为了使转换后的语音音色具，有更多的目标说话人倾向性本文主要针对激励源和韵律特征的转换进行了相应，研究主要工作如下，对于与文本无关的源一目标声音转换本文给出了一种基于混合高斯模型。，的分类线性加权组合映射方法该方法对短时特征参数采用，。描述参数空间的连续概率分布并将其作为分类器可在一定的分类数下，利用概率加权组合获得远大于分类数的映射规则提高了转换效果实验，表明该方法明显优于基于矢量量化的分类线性变换方法的转换效。果，，声门激励的形状对合成语音的音色影响很大通常采用声门闭合期间估计，得到的声门波导数作为激励信号对于声门激励的转换本文提出了一种。基于勒让德正交多项式分解的声门波导数波形参数化的方法该方法将声，，「〕波导数波形的维勒让德正交空间坐标组成的声门波导数特征矢量去，。除了矢量中各维参数的冗余因而对该特征矢量作相应源一目标的转换，相对于普通多项式系数构成的特征矢量而言转换效果更好中国科学技术大学博士论文摘要，。基频频率是激励源的重要参数对于说话人语音音色具有重要作用本。，文给出了一种与文本无关的基于的源一目标的短时基频转换方法，，为了反映出随时间的变化特征本文提出了一种从个连续短时帧组成，的基元段中提取出与文本无关的超音段基频及其变化的特征实验表明，在采用相同的转换方法下超音段基频特征的转换精度比短时基频的转换精度提高了，语句随时间变化的轨迹更能反映出说话人的个性特征，，本文给出了一种基于句类和的源一目标的语句。的转换方法，，根据语句的语调类型句子长度等进行句型的分类并按类建立源一目标，相同文本下一一对应的语句的。数据库转换时采用匹配，。算法从源说话人的语句库中选出最相近的句类再用映射方法实现，源一目标语句之间的转换最后再用短时基频的映射调整，的均值这种方法可以实现转换语句与源语句句长不相同的转换效，。果使转换后语句更接近于与目标说话人中国科学技术大学博士论文摘要、，二，，，刀，，，，即，，’一，止，，知“，圣一，娜，中国科学技术大学博士论文摘要史邓，，，而，·比犯一，’佗，别耐，，七以，，幻刀’，’，而中国科学技术人学博卜论文第一章绪论第一章绪论源一目标说话人声音转换研究背景与概述。，语音是人与人之间进行相互沟通和交流的一种最方便最自然的方式随着信号、，、处理技术模式识别技术和智能系统技术等学科的发展人们越来越希望借助计，、、、。算机的高速计算能力使其高度智能化能够听懂人类说的话自己思考并用声，音或者文字的方式表达出来这就是我们平常所说的听说读写的能力因。此高智能化的人机交互需求使语音信号处理的研究成为当前最炙手可热的科研。、。，方向语音交互的技术基础是语音识别理解与合成语音识别的研究起步于五，、，、十年代大规模的研究开始于七十年代初期经过几十年的发展从早期的元音，、。，识别到特定人小词汇量孤立词的识别到现在非特定人大词汇量的连续，，语音识别语音识别技术逐渐成熟起来语音合成即让计算机会说话是语音技，，术的另一个重要组成部分它不仅在人机交互中充当重要角色而且对语音的产。，生和感知模型等基础理论的研究也有十分重要的意义目前有限词汇量的语音、、合成已经在自动报时报警电话查询服务等方面得到了广泛的应用关于文本，。一语音的自动转换系统的研究许多国家的多个语种都已在世纪年，代处达到了商品化的程度其合成的语音质量能够为广大公众所接受和谐人机语音交互的技术基础是高稳健性的语音识别与理解技术以及高自然、。，，。度清晰度与可懂度的语音合成技术但是目前通过计算机音合成出的语音往，，往是固定的说话人的语音音色单一因而应用范围有限而目前的基于语料库。的合成语音缺乏表现力最直接的原因就是音色单一因而语，，。音科技工作者很自然地想到如果能够按照人们的特定需求合成出具有不同说话，人特征的语音无疑将大大增加合成语音的表现力和丰富性使其应用范围扩大、目前解决合成语音的音色单一问题的主要途径包括参数合成基于多个大语料库中国科学技术大学博卜论文第一章绪论，的拼接合成等然而大型语料库的建设过程非常复杂费时费力因而如何从多，。，个说话人有限的语音库出发合成出多个具有不同特征的说话人的语音就成为了，当前语音技术中迫切希望解决的问题而在这种背景下应运而生的声音转换。研究就是解决这一’题的关键技术一一单单说话人人语语音库库，，一说话人模型图单