闽南语语句基周轨迹产生两种模型之混合及比较.PDFVIP

闽南语语句基周轨迹产生两种模型之混合及比较.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
閩南語語句基週軌跡產生 :兩種模型之混合與比較 Min-Nan Sentence Pitch-contour Generation: Mixing and Comparison of Two Kinds of Models 古鴻炎 黃維 Hung-Yan Gu and Wei Huang 國立台灣科技大學資訊工程系 Dept. CSIE, National Taiwan University of Science and Technology e-mail: guhy@.tw .tw 摘要 本文對兩種基週軌跡的產生模型 ,SPC-HMM 和 ANN ,作改進與擴充然後用以建 造閩南語的基週軌跡產生模型 ,希望以閩南語作為工作語言 ,而其它的語言(如國語 、 客家語)的基週軌跡 ,能夠以調適過的閩南語所訓練出模型 ,來直接產生 。除了研究閩 南語的SPC-HMM 和ANN 模型的建造 ,我們也對此二種模型作了內外部測試之比較 , 及嘗試作模型混合的研究 ,希望能藉以提升效能 。對於所建造的閩南語基週軌跡 SPC-HMM 、ANN 、和混合模型 ,我們也作了聽測評估 ,初步的結果顯示自然度方面 , 混合模型的分數比ANN 模型的好 ,而SPC-HMM 模型的則居末 ,所以混合模型在小型 訓練語料下 ,是一個不錯的選擇 。 關鍵詞 :語音合成 ,基週軌跡 ,ANN ,HMM 1. 前言 語音合成的研究 ,最近有不少人採取 corpus based 的研究方向[1,2,3,4] 。大家也許 會認為,只要copus 夠大 ,就不需要作音調(基週軌跡)調整之信號處理 ,以保持合成單 元的信號清晰度與自然度,亦即不作基週軌跡模型建造和參數值產生的動作。可是實務 上 ,要錄音及製作夠大的corpus ,所需的人力與經費,並不是一般的研究者能夠負擔得 起 ,即使以程式自動作標音(labeling)和斷音(segmenting) ,也仍然需要作人工的校正。 然而當 corpus 不夠大時 ,會遇到的一個和基週軌跡有關的問題是,合成出的句子的語 調,缺乏人類說話時的自然下傾(declining)的表現[5] ,這會讓聽者較難掌握說話的節奏 , 而另一個可能發生的情況是 ,在合成單元的邊界 ,音調未能平順銜接。此外 ,還存在的 一個明顯問題是,合成語句的說話速度會忽快忽慢地不一致,原因應是來自不同原始語 1 句的合成單元,發音的速度不匹配。基於前述的問題 ,corpus based 的語音合成作法 , 除非是 corpus 夠大且錄音者能夠一直維持說話的平穩 ,不然還是有需要建造模型來產 生基週軌跡 ,用以檢驗所合成的語句,其語調是否有下傾的表現 ,相鄰音節間的基週軌 跡是否有不平順銜接的地方 。 其實本文研究閩南語語句基週軌跡之產生,是從另一個方向來思考台灣地區的語音 合成研究的問題,就是強勢語言的文句翻語音(text-to-speech, TTS)研究 ,匯聚了大部分 的研究資源( 人力、經費) ,而當要對另一弱勢語言作TTS 之研究時,仍然需要再投入大 量的資源,這樣的情況對於corpus based 之研究方向應是很明顯的。因此我們開始思考, 如何讓一種語言的語音合成之研究成果,能夠很經濟地轉移給另一個語言使用,如此弱 勢語言面臨的存續問題,就可獲得至少一些些的舒解。對於同樣是以音節為組成單位的 聲調語言來說 ,例如國語(北京話) 、閩南話、客家話 、廣東話...等 ,我們可先選擇其中 一個作為工作語言(working language) ,來研究它的韻律參數產生模型 ,然後透過模型調 適 ,以工作語言訓練的模型 ,來產生出標的語言(target language)的韻律參數。這樣的想 法,先前我們已曾經以基週軌跡參數為例,選擇閩南語作為工作語言,來建造它的SPC- HMM 模型[6] ,然後調適此模型以產生出國語和客家語語句的基週軌跡,初步實驗結果 顯示 ,我們的想法是可行的[7] 。 台灣的三種主要語言 :國語、閩南語、客家語,我們所以會選

文档评论(0)

kehan123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档