基于神经网络的数字语音信号识别.docVIP

下载本文档

9
0
约3.5万字
约 47页
2019-09-07 发布于湖北
举报
版权申诉

基于神经网络的数字语音信号识别.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 1 1 绪论 1.1 研究本课题的意义神经网络是一门新兴交叉学科，始于20世纪40年代，是人类智能研究的重要组成部分，已成为脑科学、神经科学、认知科学、心理学、计算机科学、数学和物理学等共同关注的焦点[1]。神经网络就是指模仿人脑神经网络的结构和某些工作机制建立一种计算模型的处理方法。神经网络作为一种新技术之所以引起人们巨大的兴趣，并越来越多地用于控制领域，是因为与传统的控制技术相比，它具有以下重要的特征和性质： ①非线性。神经网络在解决非线性控制问题方面很有希望。这来源于神经网络在理论上可以趋近任何非线性映射，人工神经网络比其他方法建模更经济。②平行分布处理。神经网络具有高度平行的结构，这使它本身可平行实现。由于分布和平行实现，因而比常规方法有更大程度的容错能力。神经网络的基本单元结构简单并行连结会有很快的处理速度。③硬件实现。这与分布平行处理的特征密切机关，也就是说它不仅可以平行实现，而且许多制造厂家已经用专用VLSI硬件来制作神经网络。这样，速度进一步提高，而且网络能实现的规模也明显增大。④学习和自适应性。利用系统过去的数据记录，可对神经网络进行训练。受适当训练的网络有能力泛化，也即当输入出现训练中未提供的数据时，网络也有能力进行辨识。神经网络也可以在线训练。⑤数据融合。神经网络可以同时对定性和定量数据进行操作在这方面，神经网络正好是传统工程系统（定量数据）和人工智能领域（符号数据）信息处理技术之间的桥梁[2]。随着计算机技术的飞速发展，人们已不再满足于让计算机做一些简单的科学计算，而是向它提出了更高的要求，即要求计算机向智能化方向发展，于是人们开始了第五代计算机(即智能计算机)的研究。计算机人工智能(AI)的研究内容有很多方面，诸如计算机视觉、计算机语音、知识处理、专家系统等。其中人机自然语言的接口是一个非常重要的部分。它要求计算机能说会听，应此要求出现了语音合成和语音识别两门学科。所谓语音识别(Speech Recognition)，就是利用计算机，对人们的语音信号进行时域或频域处理，识别出所说的是什么，通俗地讲，就是让计算机能够模拟人类的听觉功能。国际上，对计算机语音识别的研究也有近四十年的历史，经过数辈科学家和科学工作者的艰辛努力，语音识别的研究方面取得了很大的成果。尤其是近一、二十年，提出了许多有效的语音处理和识别的方法和策略，使得语音识别这门学科的研究日趋兴旺，许多的语音识别系统也正逐步实用化。人们所期望赋予计算机能说会听的梦想正步步走向现实。预计在未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域（如门禁系统，手机语音自动拨号系统）[3]。语音识别系统依照语音识别的单元、语音识别系统是否依赖人可以分成：特定人、孤立词语音识别系统；非特定人、孤立词语音识别系统；特定人、连续语音识别系统和非特定人、连续语音识别系统四类。在这四类中，按语音识别系统的词汇量大小又分成大字表，中字表和小字表语音识别系统[4]。一般地讲，几十个的词汇称为小字表，几百个的词汇称为中字表，而几千、几万个词汇的语音识别系统称为大字表语音识别系统。本课题要求是实现第二类系统。语音识别是一门综合性科学，其发展与声学、脑科学、生理学、人工智能、模式识别、数字信号处理、计算机科学等学科的发展有着密切的关系。一般常用的语音识别方法有模板匹配法，随机模型法和概率语法分析法三种识别方法[5]。目前的主流方法是随机模型法，而基于神经网络的识别方法也在被积极地研究和探讨中。 1.2 课题国内外研究情况和发展趋势神经网络早期的研究工作应追溯至本世纪40年代。1943年，心理学家W.Mcculloch和数理逻辑学家W.Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今，并且直接影响着这一领域研究的进展。因而，他们两人可称为人工神经网络研究的先驱。1945年冯·诺依曼领导的设计小组试制成功存储程序式电子计算机，标志着电子计算机时代的开始。1948年，他在研究工作中比较了人脑结构与存储程序式计算机的根本区别，提出了以简单神经元构成的再生自动机网络结构。但是，由于指令存储式计算机技术的发展非常迅速，迫使他放弃了神经网络研究的新途径，继续投身于指令存储式计算机技术的研究，并在此领域作出了巨大贡献。虽然，冯·诺依曼的名字是与普通计算机联系在一起的，但他也是人工神经网络研究的先驱之一[6]。上世纪50年代末，F·Rosenblatt设计制作了“感知机”,它是一种多层的神经网络。这项工作首次把人工神经网络的研究从理论探讨付诸工程实践。当时，世界上许多实验室仿效制作感知机，分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。然而，这次人工神经网络