- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
閩南語語句基週軌跡產生 :兩種模型之混合與比較
Min-Nan Sentence Pitch-contour Generation:
Mixing and Comparison of Two Kinds of Models
古鴻炎 黃維
Hung-Yan Gu and Wei Huang
國立台灣科技大學資訊工程系
Dept. CSIE, National Taiwan University of Science and Technology
e-mail: guhy@.tw .tw
摘要
本文對兩種基週軌跡的產生模型 ,SPC-HMM 和 ANN ,作改進與擴充然後用以建
造閩南語的基週軌跡產生模型 ,希望以閩南語作為工作語言 ,而其它的語言(如國語 、
客家語)的基週軌跡 ,能夠以調適過的閩南語所訓練出模型 ,來直接產生 。除了研究閩
南語的SPC-HMM 和ANN 模型的建造 ,我們也對此二種模型作了內外部測試之比較 ,
及嘗試作模型混合的研究 ,希望能藉以提升效能 。對於所建造的閩南語基週軌跡
SPC-HMM 、ANN 、和混合模型 ,我們也作了聽測評估 ,初步的結果顯示自然度方面 ,
混合模型的分數比ANN 模型的好 ,而SPC-HMM 模型的則居末 ,所以混合模型在小型
訓練語料下 ,是一個不錯的選擇 。
關鍵詞 :語音合成 ,基週軌跡 ,ANN ,HMM
1. 前言
語音合成的研究 ,最近有不少人採取 corpus based 的研究方向[1,2,3,4] 。大家也許
會認為,只要copus 夠大 ,就不需要作音調(基週軌跡)調整之信號處理 ,以保持合成單
元的信號清晰度與自然度,亦即不作基週軌跡模型建造和參數值產生的動作。可是實務
上 ,要錄音及製作夠大的corpus ,所需的人力與經費,並不是一般的研究者能夠負擔得
起 ,即使以程式自動作標音(labeling)和斷音(segmenting) ,也仍然需要作人工的校正。
然而當 corpus 不夠大時 ,會遇到的一個和基週軌跡有關的問題是,合成出的句子的語
調,缺乏人類說話時的自然下傾(declining)的表現[5] ,這會讓聽者較難掌握說話的節奏 ,
而另一個可能發生的情況是 ,在合成單元的邊界 ,音調未能平順銜接。此外 ,還存在的
一個明顯問題是,合成語句的說話速度會忽快忽慢地不一致,原因應是來自不同原始語
1
句的合成單元,發音的速度不匹配。基於前述的問題 ,corpus based 的語音合成作法 ,
除非是 corpus 夠大且錄音者能夠一直維持說話的平穩 ,不然還是有需要建造模型來產
生基週軌跡 ,用以檢驗所合成的語句,其語調是否有下傾的表現 ,相鄰音節間的基週軌
跡是否有不平順銜接的地方 。
其實本文研究閩南語語句基週軌跡之產生,是從另一個方向來思考台灣地區的語音
合成研究的問題,就是強勢語言的文句翻語音(text-to-speech, TTS)研究 ,匯聚了大部分
的研究資源( 人力、經費) ,而當要對另一弱勢語言作TTS 之研究時,仍然需要再投入大
量的資源,這樣的情況對於corpus based 之研究方向應是很明顯的。因此我們開始思考,
如何讓一種語言的語音合成之研究成果,能夠很經濟地轉移給另一個語言使用,如此弱
勢語言面臨的存續問題,就可獲得至少一些些的舒解。對於同樣是以音節為組成單位的
聲調語言來說 ,例如國語(北京話) 、閩南話、客家話 、廣東話...等 ,我們可先選擇其中
一個作為工作語言(working language) ,來研究它的韻律參數產生模型 ,然後透過模型調
適 ,以工作語言訓練的模型 ,來產生出標的語言(target language)的韻律參數。這樣的想
法,先前我們已曾經以基週軌跡參數為例,選擇閩南語作為工作語言,來建造它的SPC-
HMM 模型[6] ,然後調適此模型以產生出國語和客家語語句的基週軌跡,初步實驗結果
顯示 ,我們的想法是可行的[7] 。
台灣的三種主要語言 :國語、閩南語、客家語,我們所以會選
文档评论(0)