基于HMM和BP神经网络语音识别研究.docVIP

下载本文档

45
0
约4.13千字
约 9页
2018-08-28 发布于福建
举报
版权申诉

基于HMM和BP神经网络语音识别研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于HMM和BP神经网络语音识别研究

基于HMM和BP神经网络语音识别研究　　【摘要】语音识别是语音信号处理领域的研究热点，其训练效果的优劣直接关系到系统的整体性能。本文针对HMM和BP神经网络各自的优缺点，将两种方法有机地结合起来并应用于语音识别，进一步提高了语音识别的鲁棒性和准确率。　　【关键词】语音识别；HMM；BP神经网络　　【中图号】 TN912.34 【文献标示码】 A 【文章编号】 1005-1074(2008)12-0172-02 　　　　The Research of Speech Recognition Based on HMM and BP Neural Network 　　ZHANG PingZHANG Qiong 　　（Electrical Engineering department,Shaanxi Electronic Industry School, Baoji Shaanxi, 721001）　　【Abstract】 Speech recognition is a hot issue in the field of speech signal processing, the training unit is a very important part in speech recognition, and it determines the entire properties of the system. This article in view of HMM and the BP neural network respective good and bad points, organically unifies two methods and applies in the speech recognition, further enhanced the speech recognition robustness and the rate of accuracy. 　　【Keywords】 Speech recognition；HMM；BP Neural Network 　　　　1 引言　　　　随着信息时代的到来，计算机己成为人类不可缺少的日常工具，人与机器之间的交流也越来越广泛和深入。从科学研究到日常生活，计算机己经渗透到人们生活的各个方面，人们逐渐习惯借助计算机来完成各项任务。这样一来，如何让计算机智能化地与人进行通信，使人机交互更加方便快捷就成为现代通信与计算机科学研究的重要课题之一。语言是人类进行思想、观点和情感交流最自然便捷的交互形式，是人类特有的功能，而声音是人类常用的工具，是相互传递信息的最主要的手段。因此，语音信号是人们构成思想沟通和感情交流最主要途径。如果计算机能够听懂语言，能够说话，那么就不会有键盘，不同语言的人们交流也就会更容易，这个愿望实现的技术基础就是语音识别。语音识别(Speech Recognition)主要是指让机器听懂人说的话，即在各种情况下，准确地识别出语音的内容，从而根据其信息，执行人的各种意图。它是一门涉及面很广的交叉学科，与计算机、通信、语音语言学、数理统计、信号处理、神经心理学和人工智能等学科都有着密切的关系。随着计算机技术、模式识别和信号处理技术及声学技术等的发展，使得能满足各种需要的语音识别系统实现成为可能。近二三十年来，语音识别在工业、军事、交通、医学、民用诸方面，特别是在计算机、信息处理、通信与电子系统、自动控制等领域中有着广泛的应用。当今，语音识别产品在人机交互应用中，已经占到越来越大的比例[1]。　　　　2 语音识别系统的基本原理　　　　语音识别一般分两个步骤。第一步是系统“学习”阶段，主要任务是根据识别系统的类型选择能够满足要求的一种识别方法，采用语音分析方法分析出这种识别方法所要求的语音特征参数，这些参数作为标准模式由机器存储起来，形成标准模式库，而这个语音参数库就称为“模板”。第二步是“识别”阶段，即按一定的准则与系统模型比较，通过判决得出识别结果。根据模式匹配原理构成的语音识别系统如图1所示。　　　　如图所示，语音识别系统包含预处理、特征提取、模式匹配、参考模式和后处理几部分。预处理指在特征提取之前，先对原始语音进行处理，部分地消除噪声和不同说话人带来的影响，使处理后的信号更能反映语音的本质特征，它包括预滤波、采样、模/数变换、自动增益控制、预加重、分帧加窗及端点检测等；特征参数提取指求取语音信号特征的参数，如短时幅度、能量过零率、自相关函数、LPC系数等；每个参考模式对应系统词汇表中每个识别单元的特征参数；模式匹配指度量待识别词的特征构成的测试模式与系统所储存的每个参考模式之间的距离[2][3]；