- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本论文的应用情境是在储存空间有限的汽车装置上建置一个给.PDF
摘要
本論文的應用情境是在儲存空間有限的汽車裝置上建置一個給台灣人使用
的 華英雙語語音辨識系統,預期在不使用語言辨識的情況下,有效縮減模型空間
大小 ,並和單語辨識系統有相當的辨識效能。
本研究透過合併雙語間相似的聲學單位來縮減模型大小,透過華英雙語不同
標音的整合方式,尋找華英雙語之間適合合併的聲學單位,並且實作各種聲學單
位的合併方法來建構雙語系統。
除了進行聲學單位的合併之外,本論文以決策樹的方式進行狀態單位之合併,
實驗結果顯示以決策樹建構的分類、合併原則,能以更細微的角度合併華英雙語
之間相似的狀態,不僅能有效縮減模型空間,亦能增加模型的強健程度。以決策
樹進行模型合併的實驗可以將模型大小縮減成原來的三分之一,並且擁有比基礎
模型高出 1.2%的雙語整體辨識效能。
關鍵字: 華英雙語辨識系統、聲學模型合併 、華英雙語問題 集
II
Abstract
The long-term goal of this research is to construct a Mandarin-English bilingual
speech recognition system on devices mounted on automobiles with limited storage
size. Thus, the purpose of this thesis is to effectively reduce the model size and to
maintain considerable performance as a unilingual system without using language
identification.
In this thesis, similar acoustic models are merged to reduce the number of model
parameters. Similar acoustic units between the two languages are found by analyzing
different phonetic notations with either knowledge-driven or data-driven techniques.
In addition to directly merging the two acoustic models, this thesis also proposes
the use of decision trees to merge states of different HMMs (hidden Markov models).
Experimental result shows that, merging the models in a finer level via decision trees
not only effectively reduces the model size but also enhances robustness of the
bilingual models. By comparing to the baseline models, the state mergence using
decision trees can reduce model size to one third of the original one and achieve an
improvement of 1.2% in correction rate of bilingual recognition.
Keywords: Mandarin-English bilingual recognition system, mergence of bilingual
acoustic models, Mandarin-English bilingual question sets
文档评论(0)