- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
监别性事前资讯应用於强健性语音辨识.PDF
鑑別性事前資訊應用於強健性語音辨識
丁川偉 吳柏樹 簡仁宗
國立成功大學資訊工程學系
{cwting, bswu, chien}@chien.csie.ncku.edu.tw
摘要
在傳統語音辨識系統中 ,模型的訓練環境與測試環境不匹配(mismatch)是造成辨識率下降的首要
問題 ,在此議題上 ,過去文獻已提出許多解決方法 ,如在語音模型端引入模型參數的不確定性所
建立的強健性貝氏預測分類(Bayesian predictive classification)法則 ,或是調整模型於測試環境的
調適方法 ,如最大事後機率(MAP)調適以及線性迴歸(MLLR)調適 ,甚至進一步考慮語音模型鑑
別性之最小分類錯誤線性迴歸(MCELR)調適等方法 。其中 ,貝氏預測分類法則是將模型參數的
不確定性(uncertainty)適當的引入決策法則以達到決策方法的強健性 ,而參數不確定性反應了雜
訊環境及聲學的變異性 ,它可由事前機率(prior density)來表示 ,而傳統上貝氏學習則提供了估測
並更新參數事前資訊的機制 。
為兼顧決策法則的強健性及鑑別性 ,本論文提出在貝氏預測分類架構下聲學模型及其事前
機率模型之鑑別性訓練及更新 ,我們使用最小分類錯誤(MCE)之鑑別性準則來估測模型參數之超
參數(hyperparameter) ,並且提出了兩種更新的方法 ,其一是直接針對隱藏式馬可夫模型平均值向
量參數更新其事前統計量 ;其二是考慮線性迴歸調整 ,針對迴歸矩陣之事前資訊在最小分類錯誤
準則下做更新 。在以汽車噪音雜訊語音資料庫為主的評估實驗中 ,發現使用更新過後的事前機率
可以提昇貝氏預測分類之鑑別性 ,達成強健性語音辨識效能提升之目的 。
1. 緒論
語音是人與人之間最直接 、最自然溝通的方式 ,隨著科技和語音辨認技術的進步 ,讓機械聽懂人
類的話 ,不再是遙不可及的夢想 。目前實際應用面中 ,語音辨識的過程仍舊存在著許多問題 ,最
常遇到的 ,像是訓練環境與測試環境的不匹配問題 ,因為語音辨識主要是以樣本比對(pattern
recognition)的技術為基礎 ,若是語音辨識之應用環境與原始樣本之訓練環境不匹配 ,將會使得辨
識率大幅地降低 ,而這不匹配可能是來自於週遭的環境噪音 、傳輸語音的通道不同 、或語者不同
等 ,影響語音辨識的因素往往是上述多個失真來源的組合 。因此 ,為了克服語音辨識時不匹配之
問題 ,強健且有效率的補償技術一直是語音辨識極為重要的研究議題 。
在此研究領域上 ,已有許多學者提出不同方法來解決不匹配的問題 ,我們將之大致分為訊號
(signal)空間 、特徵參數(feature)空間 、以及模型參數(model parameter)空間三類 。在第一種方法中 ,
主要以語音強化(speech enhancement)的方式為主 ,其觀點是將受到環境影響的訊號 ,透過訊號處
理的方式 ,消減噪音的部份以得到近似乾淨的訊號 ;第二種方法 ,與訊號空間的處理觀念類似 ,
都是希望還原原始環境下的特徵參數特性 ,做特徵參數的補償(compensation) ;最後一種則是對
已經訓練完成的模型參數做處理 ,其方法可再細分為兩種 :其一是利用新環境所得到的少量語料
將原有之模型參數調適到與新環境接近的方式 ;另一則是在模型參數中考量其不確定性 ,以減少
新環境中模型變異所造成的影響 ,進而達到強健性決策的機制 。此外在模型的訓練當中 ,不同模
型之間的參數或分佈常會面臨混淆的情況 ,造成分類錯誤的提升 ,因此鑑別性(discriminability)
的考量也被學者提出引入模型的訓練過程 ,以期達到更明確之模型並降低分類的錯誤 。
在本研究 中 ,主要是在考量參數不確定性的基礎上 ,希望能夠在鑑別性的分類方法考量下更
新其參數的不確定性 ,以期望進一步達成同時具有鑑別性事前機率的強健性之決策法則 。另外在
本研究中也將此考量不確定性且具鑑別性的事前機率學習 ,落實在模型參數的調整 ,並分為直接
對模型參數的調整以及間接對模型參數做調整 。在以汽車噪音為主的連續數字語料庫中 ,都能達
到辨識效能的提升 。而在本文的編排上 ,共分為五個小節 ,除了第一節為緒論外 ;第二節將簡單
介
您可能关注的文档
- 求解稳态N鄄S方程的Uzawa算法的几何收敛性-南京师范大学学报.PDF
- 求解非线性互补问题的一类光滑牛顿算法-沈阳航空航天大学.PDF
- 汇率变动、流动性过剩与通货膨胀的动态关系-经济学动态.PDF
- 汇算清缴时-郑州市地税局纳税人学堂.ppt
- 汉字应用水平测试用字的统计与分级汉字应用水平测试研究课题组.doc
- 汉字识别中以词为分类单位的分类器研究-中文信息学报.PDF
- 汉语音节一音位层次分析-中山大学中国古文献研究所.PDF
- 江苏省专转本高等数学模拟测试题.doc
- 江苏省住院医师规范化培训临床技能考核的几点体会-南京医科大学.ppt
- 江苏省农村结核病诊断与治疗可及性影响因素的定性-中国科技论文在线.PDF
文档评论(0)