- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
voicebox基特定人的孤立词汇语音识别系统研究
voicebox基特定人的孤立词汇语音识别系统研究
本论文研究基于特定人的孤立词汇语音识别系统。主要工作是完成对语音信号的预处理(包括预加重、分帧、加窗、端点检测等),特征参数的提取、模板匹配,最终寻找最匹配项,输出匹配结果。
论文首先介绍了语音识别的基本原理、语音识别系统结构,然后详细讨论了MFCC参数的提取以及DTW(动态时间规整)算法等,最后针对特定人的孤立词汇,进行了识别实验,得到实验结果。DTW算法对硬件环境要求低,计算速度快,十分适合语音库较小情况下特定人孤立词汇的语音识别。
该识别系统采用Matlab 2010b作为开发工具,使用voicebox作为开发工具包,实现对声音文件的各种操作。并且,本系统采用了GUI(图形界面),使用更加直观。6635
关键词特定人 孤立词汇 语音识别 MFCC DTW
毕业设计说明书(论文)外文摘要
TitleA Speaker-independent and Isolated-word Speech Recognition
Abstract
In this paper, we studied the speaker-independent and isolated-word speech recognition system. This system completed the task of pre-processing of speech signals (including pre-emphasis, frame blocking, windowing and end point detecting), extracting of the parameter, template matching and finally, finding out the match and outputting the results. After this process, we conduct the statistical results in order to illustrate the performance of this system.
This paper introduces the principles of speech recognition, the construction of speech recognition system in the first place. Then, this paper discussed MFCC extraction and DTW(dynamic time warping) algorithm, etc. in detail. Finally, aiming at speaker-independent isolated words, this paper conducted a speech recognition experiment and received the results. DTW has a reputation of low hardware requirements and high computing speed, which makes it fit for speaker-independent and isolated-word speech recognition with a relatively small library.
广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。
1.1语音识别的历史背景
早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。[2]而1920年代生产的quot;Radio Rexquot;玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由ATamp;T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。1960年代,人工神经网络被引入了语
原创力文档


文档评论(0)