不需平行语料而基于共振峰与不需平行语料而基于共振峰与线频谱.PDF

下载文档 降价啦

0
0
约3.03万字
约 14页
2019-04-13 发布于天津
举报
版权申诉
保障服务

不需平行语料而基于共振峰与不需平行语料而基于共振峰与线频谱.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

不需平行語料而基於共振峰與線頻譜頻率映對之不需平行語料而基於共振峰與線頻譜頻率映對之不需平行語料而基於共振峰與不需平行語料而基於共振峰與線頻譜頻率映對之線頻譜頻率映對之語者特質轉換系統語者特質轉換系統語者特質轉換系統語者特質轉換系統 A Voice Conversion System based on Formant and LSF Mapping without Using Parallel Corpus 吳嘉彧 Chia-Yu Wu 國立清華大學電機工程學系 Department of Electrical Engineering National Tsing Hua University u921802@ 王小川 Hsiao-Chuan Wang 國立清華大學電機工程學系 Department of Electrical Engineering National Tsing Hua University hcwang@.tw 摘要語者特質轉換的研究已有廣泛的運用，早期使用的向量量化碼本對照，與目前被廣為使用的高斯混合模型，都會使用經動態時軸校準的平行對應語句作訓練。近年來已有減少使用訓練語料與使用非平行句的語料進行語者特質轉換的方法。本論文提出一個不採用平行句的訓練方法，而依據語者音節共振峰映對，並結合線頻譜頻率映對，進行語者特質轉換。 Abstract Voice conversion has been used in many applications. The methods based on vector quantization codebook and Gaussian mixture models need dynamic time warping on parallel sentence corpus for generating mapping functions. Recent study tries to use less training data, and even without parallel sentence corpus. This paper presents a voice conversion method without using parallel sentence corpus. It applies the formant mapping and line spectral frequency mapping to accomplish a voice conversion system. 關鍵詞：語者特質轉換，平行句語料，共振峰映對，線頻譜頻率映對 Keywords: voice conversion, parallel sentence corpus, formant mapping, LSF mapping 319 一、緒論語音轉換和語者特質轉換已被探討多年，目前的研究除了提升轉換相似度以及保持語音品質，也要考慮實用層面會遇到的問題。例如為了使用者的便利，訓練語料要減少，並要考慮跨語言語者特質轉換等沒有平行對應語句供訓練的情況，因此針對不同用途所使用的轉換方法和訓練語料都要有所調整。語者特質轉換必須轉換來源語料的頻譜參數與韻律參數，使頻譜與韻律變成有