监别性事前资讯应用於强健性语音辨识.PDFVIP

下载本文档

0
0
约4.16万字
约 16页
2017-12-16 发布于天津
举报
版权申诉

监别性事前资讯应用於强健性语音辨识.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

监别性事前资讯应用於强健性语音辨识.PDF

鑑別性事前資訊應用於強健性語音辨識丁川偉吳柏樹簡仁宗國立成功大學資訊工程學系 {cwting, bswu, chien}@chien.csie.ncku.edu.tw 摘要在傳統語音辨識系統中，模型的訓練環境與測試環境不匹配(mismatch)是造成辨識率下降的首要問題，在此議題上，過去文獻已提出許多解決方法，如在語音模型端引入模型參數的不確定性所建立的強健性貝氏預測分類(Bayesian predictive classification)法則，或是調整模型於測試環境的調適方法，如最大事後機率(MAP)調適以及線性迴歸(MLLR)調適，甚至進一步考慮語音模型鑑別性之最小分類錯誤線性迴歸(MCELR)調適等方法。其中，貝氏預測分類法則是將模型參數的不確定性(uncertainty)適當的引入決策法則以達到決策方法的強健性，而參數不確定性反應了雜訊環境及聲學的變異性，它可由事前機率(prior density)來表示，而傳統上貝氏學習則提供了估測並更新參數事前資訊的機制。為兼顧決策法則的強健性及鑑別性，本論文提出在貝氏預測分類架構下聲學模型及其事前機率模型之鑑別性訓練及更新，我們使用最小分類錯誤(MCE)之鑑別性準則來估測模型參數之超參數(hyperparameter) ，並且提出了兩種更新的方法，其一是直接針對隱藏式馬可夫模型平均值向量參數更新其事前統計量；其二是考慮線性迴歸調整，針對迴歸矩陣之事前資訊在最小分類錯誤準則下做更新。在以汽車噪音雜訊語音資料庫為主的評估實驗中，發現使用更新過後的事前機率可以提昇貝氏預測分類之鑑別性，達成強健性語音辨識效能提升之目的。 1. 緒論語音是人與人之間最直接、最自然溝通的方式，隨著科技和語音辨認技術的進步，讓機械聽懂人類的話，不再是遙不可及的夢想。目前實際應用面中，語音辨識的過程仍舊存在著許多問題，最常遇到的，像是訓練環境與測試環境的不匹配問題，因為語音辨識主要是以樣本比對(pattern recognition)的技術為基礎，若是語音辨識之應用環境與原始樣本之訓練環境不匹配，將會使得辨識率大幅地降低，而這不匹配可能是來自於週遭的環境噪音、傳輸語音的通道不同、或語者不同等，影響語音辨識的因素往往是上述多個失真來源的組合。因此，為了克服語音辨識時不匹配之問題，強健且有效率的補償技術一直是語音辨識極為重要的研究議題。在此研究領域上，已有許多學者提出不同方法來解決不匹配的問題，我們將之大致分為訊號 (signal)空間、特徵參數(feature)空間、以及模型參數(model parameter)空間三類。在第一種方法中，主要以語音強化(speech enhancement)的方式為主，其觀點是將受到環境影響的訊號，透過訊號處理的方式，消減噪音的部份以得到近似乾淨的訊號；第二種方法，與訊號空間的處理觀念類似，都是希望還原原始環境下的特徵參數特性，做特徵參數的補償(compensation) ；最後一種則是對已經訓練完成的模型參數做處理，其方法可再細分為兩種：其一是利用新環境所得到的少量語料將原有之模型參數調適到與新環境接近的方式；另一則是在模型參數中考量其不確定性，以減少新環境中模型變異所造成的影響，進而達到強健性決策的機制。此外在模型的訓練當中，不同模型之間的參數或分佈常會面臨混淆的情況，造成分類錯誤的提升，因此鑑別性(discriminability) 的考量也被學者提出引入模型的訓練過程，以期達到更明確之模型並降低分類的錯誤。在本研究中，主要是在考量參數不確定性的基礎上，希望能夠在鑑別性的分類方法考量下更新其參數的不確定性，以期望進一步達成同時具有鑑別性事前機率的強健性之決策法則。另外在本研究中也將此考量不確定性且具鑑別性的事前機率學習，落實在模型參數的調整，並分為直接對模型參數的調整以及間接對模型參數做調整。在以汽車噪音為主的連續數字語料庫中，都能達到辨識效能的提升。而在本文的編排上，共分為五個小節，除了第一節為緒論外；第二節將簡單介