网站大量收购闲置独家精品文档,联系QQ:2885784924

基於反转档查找与最佳片段选取演算法的中文语音合成系统.PDFVIP

基於反转档查找与最佳片段选取演算法的中文语音合成系统.PDF

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基於反转档查找与最佳片段选取演算法的中文语音合成系统

基於反轉檔查找與最佳片段選取演算法的中文語音合成系統 林政源 謝明峰 陳冠廷 張智星 國立清華大學資訊工程學系 {gavins, pacific, marco, jang}@.tw 摘要 本論文主要是解決以大量語料庫為基礎的語音合成的兩個問題,其一是搜尋比對大量語料庫非常費 時,其二是從不同語句所取出的片段語音檔來加以接合,因為韻律參數的不一致,會使聽者明顯感覺不 自然。因此,我們提出了反轉檔查找技巧來解決搜尋時間的問題,為求整體句子的自然韻律表現,我們 提出了最佳片段選取演算法來達成這個目標,而對於PSOLA在調整音長表現可能不佳的情形,我們改以 WSOLA方式實作。在搜尋比對時間與MOS評分的實驗中,我們均獲得到了不錯的成果。 1 系統簡介 近年來,隨著電腦科技不斷的蓬勃發展,中文文字轉語音 (TTS, Text-To-Speech) 的合成系統也慢慢朝向 由單音節為主的合成單元架構轉變成以大量語料庫 (large corpus-based) 為主的合成單元架構。這方面的 研究目前有 Heo-Jin Byeon 的Event-Driven f0 Weighting[5], 大陸學者Min Chu 等人的Domain Adaptation[1]的方法, Ivan Bulyko提出的BMM models[6]以及台大周福強博士的decision trees方法[10]等。 一般而言, 採用大量語料庫的系統,其合成品質較單音節為主的系統來的好。因為它的方法是直 接從語料庫擷取所需要的片段進行接合,所以在韻律表現上會較自然,也因為如此,在聲音方面所需調 整的地方就會不太多,這也避免了聲音經過調整後而造成音質破壞的疑慮。然而,採用大量語料庫的做 法也有其缺點,以下列出二個常見的問題: 1. 輸入文句需要和大量語料庫作比對: 文句經過斷詞以後,再去語料庫找尋可能的詞句片段,並取出後加以接合,然而若演算法設 計不當則會讓比對時間相對費時,所以發展一個有效率的演算法來縮短比對時間對系統的效能是非 常重要的。 2. 詞句片段之間的韻律參數差異性問題: 從不同語句所取出的片段語音檔來加以接合,因為韻律參數的不協調,會使聽者明顯感覺不 自然。 有鑑於兩種缺點的考量,本論文採用反轉檔查找技巧來降低比對時間,而以動態規劃演算法來尋找 最佳的接合片段使其合成自然度提升。這兩種方法將在第三以及第四節中論述。 2 系統架構說明 本論文所建立的中文語音合成系統架構將如下圖表示: 輸入文字 詞庫 文句分析 語言參數 韻律參 韻律產生器 數資料 語料庫尋找比對 韻律參數 語音合成器 語音檔案 輸出語音 圖1. 中文文字轉語音系統流程圖 此系統主要分為四大類: 1. 文句分析:將所輸入的文字加以分析,得到音節以及詞的語言參數。 2. 韻律產生器:將語言參數轉換成語音合成所需要的韻律參數,而韻律產生器所需要的參數資料,是 以類神經網路來獲得。 3. 語音合成器:根據韻律參數,將語料庫中所得到的語音檔案加以調整。 4. 語料庫搜尋比對:這是本論文最重要的一環,主要是將分句分析的結果和語料庫作比較查詢,並找 出最適當的語音檔案當作輸出。 2.1 文句分析 當文句輸入時,第一步驟就是針對此文句做分析,以得到其語言參數,如此才可進一步的得到韻律參數,

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档