- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Proceedings of the Twenty-Fifth Conference on Computational Linguistics and Speech Processing (ROCLING 2013)
分頻式調變頻譜分解於強健性語音辨識
Sub-band modulation spectrum factorization in robust speech
recognition
范顥騰 Hao-teng Fan
國立暨南國際大學電機工程學系
Department of Electrical Engineering
National Chi Nan University
.tw
蔡益彰 Yi-zhang Cai
國立暨南國際大學電機工程學系
Department of Electrical Engineering
National Chi Nan University
.tw
洪志偉 Jeih-weih Hung
國立暨南國際大學電機工程學系
Department of Electrical Engineering
National Chi Nan University
jwhung@.tw
摘要
在本篇論文中,我們使用了非負矩陣分解(nonnegative matrix factorization, NMF)技術來
強化語音特徵調變頻譜、藉此提升自動語音辨識系統之雜訊強健性,其中,NMF 法為
語音之調變頻譜的強度求取一組基底向量,而我們藉由此組基底向量來擷取語音中重要
的辨識成分,跟以往基於 NMF 之強健技術不同之處在於兩點:其一,我們利用了正交
投影(orthogonal projection)的方式取代原先的迭代方式,使運算速度大幅增加。其二,
我們採取分頻帶分解的方式取代原先全頻帶分解,藉此減少計算量。在 Aurora-2 之連
續數字資料庫之辨識實驗顯示,上述的新方法相對於基礎實驗而言,能有效提升雜訊環
境下語音辨識的精確度,可提供高達 58%的相對錯誤改善率,而跟原 NMF 法相較,新
方法運算複雜度明顯降低,而能維持原辨識精確度、部分甚至有提升的效果。
Abstract
This paper proposes a novel scheme that enhance the modulation spectrum of speech features
in noise speech recognition via non-negative matrix factorization (NMF). In the presented
approach, we apply NMF to obtain a set of non-negative basis spectra vectors which derived
from the clean speech to represent the important components for speech recognition. The
difference compare
您可能关注的文档
最近下载
- 医师访谈记录.pdf VIP
- Unit 4 School Life 第3-4课时Reading and Rriting 课件 中职高一学年英语高教版基础模块1.ppt
- 最新中药饮片质量标准通则(试行).doc VIP
- 医学临床三基(输血学)-输血免疫学基础(精选试题).pptx VIP
- 我们的大脑的教学课件.ppt VIP
- 洞察世间智慧:哲学伴随我成长课件.ppt VIP
- 超星网课《汽车之旅》超星尔雅答案2023章节测验答案.doc VIP
- 老年人继承法培训课件.pptx VIP
- 科学湘科版二年级上册全册课件.pptx
- 第7课全球航路的开辟和欧洲早期殖民扩张【中职专用】《世界历史》(高教版2023基础模块).pptx VIP
文档评论(0)