使用字典学习法於强健性语音辨识.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用字典学习法於强健性语音辨识

Computational Linguistics and Chinese Language Processing Vol. 21, No. 2, December 2016, pp. 35-54 35 The Association for Computational Linguistics and Chinese Language Processing  使用字典學習法於強健性語音辨識 The Use of Dictionary Learning Approach for Robustness Speech Recognition     顏必成 、石敬弘 、劉士弘 、陳柏琳 Bi-Cheng Yan, Chin-Hong Shih, Shih-Hung Liu and Berlin Chen 摘要 在有雜訊的環境下,自動語音辨識系統(Automatic Speech Recognition, ASR)的 效能往往會有明顯衰退的現象。本論文旨在研究語音強健性技術,希望能夠透 過語音特徵的調變頻譜(Modulation Spectrum)正規化以萃取出較具有強健性的 語音特徵。為此,我們使用 K-奇異值分解(K-SVD)的字典學習法(Dictionary Learning)於分解調變頻譜的強度(Magnitude)成分,在最小化還原訊號誤差且在 其權重矩陣稀疏性的限制下,希望能獲取較具強健性的語音特徵。此外,因調 變頻譜強度成分皆為正值,所以我們提出非負 K-SVD 的方法來解決這個議題, 希望能增進自動語音辨識系統在抗噪上的效能。本論文的所有實驗皆於國際通 用的 Aurora-2 連續數字資料庫進行;實驗結果顯示相較於僅使用梅爾倒頻譜 係數(Mel-Frequency Cepstral Coefficient, MFCC)之基礎實驗和其它常見的調變 頻譜分解方法,我們所提出的字典學習法與其改進方法皆能顯著地降低語音辨 識錯誤率。最後,我們也嘗試將所提出的字典學習方法與一些經典的強健性技 術結合,如:進階前端標準法(Advanced Front-End, AFE) 、變異數正規化法 (Cepstral Mean and Variance Normalization, CMVN) 、統計圖等化法(Histogram Equalization, HEQ) ,以驗證其實用性。 關鍵字: 強健性、自動語音辨識、調變頻譜、稀疏編碼、字典學習法。                                                         國立臺灣師範大學資訊工程學系 Department of Computer Science and Information Engineering, National Taiwan Normal University E-mail: ,, berlin}@.tw 中央研究院資訊科學研究所 Institute of Information Science, Academia Sinica E-mail: journey@.tw 36 顏必成 等 Abstract The performance of automatic speech recognition (ASR) often degrades dramatically in noisy envi

文档评论(0)

ldj215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档