闽南语语句基周轨迹产生两种模型之混合及比较.PDFVIP

下载本文档

7
0
约2.06万字
约 14页
2017-06-04 发布于福建
举报
版权申诉

闽南语语句基周轨迹产生两种模型之混合及比较.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

閩南語語句基週軌跡產生 :兩種模型之混合與比較 Min-Nan Sentence Pitch-contour Generation: Mixing and Comparison of Two Kinds of Models 古鴻炎黃維 Hung-Yan Gu and Wei Huang 國立台灣科技大學資訊工程系 Dept. CSIE, National Taiwan University of Science and Technology e-mail: guhy@.tw .tw 摘要本文對兩種基週軌跡的產生模型，SPC-HMM 和 ANN ，作改進與擴充然後用以建造閩南語的基週軌跡產生模型，希望以閩南語作為工作語言，而其它的語言(如國語、客家語)的基週軌跡，能夠以調適過的閩南語所訓練出模型，來直接產生。除了研究閩南語的SPC-HMM 和ANN 模型的建造，我們也對此二種模型作了內外部測試之比較，及嘗試作模型混合的研究，希望能藉以提升效能。對於所建造的閩南語基週軌跡 SPC-HMM 、ANN 、和混合模型，我們也作了聽測評估，初步的結果顯示自然度方面，混合模型的分數比ANN 模型的好，而SPC-HMM 模型的則居末，所以混合模型在小型訓練語料下，是一個不錯的選擇。關鍵詞：語音合成，基週軌跡，ANN ，HMM 1. 前言語音合成的研究，最近有不少人採取 corpus based 的研究方向[1,2,3,4] 。大家也許會認為，只要copus 夠大，就不需要作音調(基週軌跡)調整之信號處理，以保持合成單元的信號清晰度與自然度，亦即不作基週軌跡模型建造和參數值產生的動作。可是實務上，要錄音及製作夠大的corpus ，所需的人力與經費，並不是一般的研究者能夠負擔得起，即使以程式自動作標音(labeling)和斷音(segmenting) ，也仍然需要作人工的校正。然而當 corpus 不夠大時，會遇到的一個和基週軌跡有關的問題是，合成出的句子的語調，缺乏人類說話時的自然下傾(declining)的表現[5] ，這會讓聽者較難掌握說話的節奏，而另一個可能發生的情況是，在合成單元的邊界，音調未能平順銜接。此外，還存在的一個明顯問題是，合成語句的說話速度會忽快忽慢地不一致，原因應是來自不同原始語 1 句的合成單元，發音的速度不匹配。基於前述的問題，corpus based 的語音合成作法，除非是 corpus 夠大且錄音者能夠一直維持說話的平穩，不然還是有需要建造模型來產生基週軌跡，用以檢驗所合成的語句，其語調是否有下傾的表現，相鄰音節間的基週軌跡是否有不平順銜接的地方。其實本文研究閩南語語句基週軌跡之產生，是從另一個方向來思考台灣地區的語音合成研究的問題，就是強勢語言的文句翻語音(text-to-speech, TTS)研究，匯聚了大部分的研究資源( 人力、經費) ，而當要對另一弱勢語言作TTS 之研究時，仍然需要再投入大量的資源，這樣的情況對於corpus based 之研究方向應是很明顯的。因此我們開始思考，如何讓一種語言的語音合成之研究成果，能夠很經濟地轉移給另一個語言使用，如此弱勢語言面臨的存續問題，就可獲得至少一些些的舒解。對於同樣是以音節為組成單位的聲調語言來說，例如國語(北京話) 、閩南話、客家話、廣東話...等，我們可先選擇其中一個作為工作語言(working language) ，來研究它的韻律參數產生模型，然後透過模型調適，以工作語言訓練的模型，來產生出標的語言(target language)的韻律參數。這樣的想法，先前我們已曾經以基週軌跡參數為例，選擇閩南語作為工作語言，來建造它的SPC- HMM 模型[6] ，然後調適此模型以產生出國語和客家語語句的基週軌跡，初步實驗結果顯示，我們的想法是可行的[7] 。台灣的三種主要語言：國語、閩南語、客家語，我們所以會選