监别性事前资讯应用於强健性语音辨识.PDFVIP

监别性事前资讯应用於强健性语音辨识.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
监别性事前资讯应用於强健性语音辨识.PDF

鑑別性事前資訊應用於強健性語音辨識 丁川偉 吳柏樹 簡仁宗 國立成功大學資訊工程學系 {cwting, bswu, chien}@chien.csie.ncku.edu.tw 摘要 在傳統語音辨識系統中 ,模型的訓練環境與測試環境不匹配(mismatch)是造成辨識率下降的首要 問題 ,在此議題上 ,過去文獻已提出許多解決方法 ,如在語音模型端引入模型參數的不確定性所 建立的強健性貝氏預測分類(Bayesian predictive classification)法則 ,或是調整模型於測試環境的 調適方法 ,如最大事後機率(MAP)調適以及線性迴歸(MLLR)調適 ,甚至進一步考慮語音模型鑑 別性之最小分類錯誤線性迴歸(MCELR)調適等方法 。其中 ,貝氏預測分類法則是將模型參數的 不確定性(uncertainty)適當的引入決策法則以達到決策方法的強健性 ,而參數不確定性反應了雜 訊環境及聲學的變異性 ,它可由事前機率(prior density)來表示 ,而傳統上貝氏學習則提供了估測 並更新參數事前資訊的機制 。 為兼顧決策法則的強健性及鑑別性 ,本論文提出在貝氏預測分類架構下聲學模型及其事前 機率模型之鑑別性訓練及更新 ,我們使用最小分類錯誤(MCE)之鑑別性準則來估測模型參數之超 參數(hyperparameter) ,並且提出了兩種更新的方法 ,其一是直接針對隱藏式馬可夫模型平均值向 量參數更新其事前統計量 ;其二是考慮線性迴歸調整 ,針對迴歸矩陣之事前資訊在最小分類錯誤 準則下做更新 。在以汽車噪音雜訊語音資料庫為主的評估實驗中 ,發現使用更新過後的事前機率 可以提昇貝氏預測分類之鑑別性 ,達成強健性語音辨識效能提升之目的 。 1. 緒論 語音是人與人之間最直接 、最自然溝通的方式 ,隨著科技和語音辨認技術的進步 ,讓機械聽懂人 類的話 ,不再是遙不可及的夢想 。目前實際應用面中 ,語音辨識的過程仍舊存在著許多問題 ,最 常遇到的 ,像是訓練環境與測試環境的不匹配問題 ,因為語音辨識主要是以樣本比對(pattern recognition)的技術為基礎 ,若是語音辨識之應用環境與原始樣本之訓練環境不匹配 ,將會使得辨 識率大幅地降低 ,而這不匹配可能是來自於週遭的環境噪音 、傳輸語音的通道不同 、或語者不同 等 ,影響語音辨識的因素往往是上述多個失真來源的組合 。因此 ,為了克服語音辨識時不匹配之 問題 ,強健且有效率的補償技術一直是語音辨識極為重要的研究議題 。 在此研究領域上 ,已有許多學者提出不同方法來解決不匹配的問題 ,我們將之大致分為訊號 (signal)空間 、特徵參數(feature)空間 、以及模型參數(model parameter)空間三類 。在第一種方法中 , 主要以語音強化(speech enhancement)的方式為主 ,其觀點是將受到環境影響的訊號 ,透過訊號處 理的方式 ,消減噪音的部份以得到近似乾淨的訊號 ;第二種方法 ,與訊號空間的處理觀念類似 , 都是希望還原原始環境下的特徵參數特性 ,做特徵參數的補償(compensation) ;最後一種則是對 已經訓練完成的模型參數做處理 ,其方法可再細分為兩種 :其一是利用新環境所得到的少量語料 將原有之模型參數調適到與新環境接近的方式 ;另一則是在模型參數中考量其不確定性 ,以減少 新環境中模型變異所造成的影響 ,進而達到強健性決策的機制 。此外在模型的訓練當中 ,不同模 型之間的參數或分佈常會面臨混淆的情況 ,造成分類錯誤的提升 ,因此鑑別性(discriminability) 的考量也被學者提出引入模型的訓練過程 ,以期達到更明確之模型並降低分類的錯誤 。 在本研究 中 ,主要是在考量參數不確定性的基礎上 ,希望能夠在鑑別性的分類方法考量下更 新其參數的不確定性 ,以期望進一步達成同時具有鑑別性事前機率的強健性之決策法則 。另外在 本研究中也將此考量不確定性且具鑑別性的事前機率學習 ,落實在模型參數的調整 ,並分為直接 對模型參數的調整以及間接對模型參數做調整 。在以汽車噪音為主的連續數字語料庫中 ,都能達 到辨識效能的提升 。而在本文的編排上 ,共分為五個小節 ,除了第一節為緒論外 ;第二節將簡單 介

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档