神经网络语音信号识别与特征值提取的研究.pdfVIP

下载本文档

6
0
约1.24万字
约 9页
2017-08-31 发布于安徽
举报
版权申诉

神经网络语音信号识别与特征值提取的研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

神经网络语音信号识别与特征值提取的研究刘剑1，崔远慧1，成川2 (1．大连轻工业学院信息科学与工程学院2大连海事大学航海学院) 亟摘要：(针对语音信号的实时处理问题，利用神经网络用于模式识别的优越性，提出一种混合语音识别模型——时间规整神经网络加BP网络分类模型，、对特定人和非特定人的孤立词的特征值进行提取；在时域中采用短时过零分析和幅值概率分析，在频域中采用功率谱密度、快速傅里叶变换、线性预测系数的方法提取特征参数，通过实验进一步改进特征提取的算法，并加以比较可知时域的特征提取方法不能迭到语音识别的要求，而频域的方法提取的特征样本经BP神经网络语音识别摸型训练，基本满足语音识到的要求。关键词：语音信号识别；特征值提取；神经网络 0引言以数字信号处理技术为基础的语音信号处理是一门新兴的交叉学科。随着社会的不断发展，计算机的迅速普及，人们渴望一种符合人类自然交往的“人机对话”模式的出现，特别是人机自然语言对话。目前一些专家和学者在这方面进行了大量的开发和研究工作。但语音识别技术正处于蓬勃发展的时期，仍有待进行大量的研究工作以取得更进一步的突破。语音识别的关键技术包括特征参数提取技术、模式匹配准则及模式训练技术等，而要提高语音识别的识别率，提取合适的特征参数是前提。如何提取合适的特征参数，为基于神经网络的语音识别提供样本，可考虑的方法如下： (1)采用时域特征参数，如短时过零分析和幅值概率分析； (2)采用频域特征参数，如功率谱密度、快速傅里叶变换和线性预测系数。将所提取的特征参数进行比较分析，选择合适的n组参数，作为人工神经网络语音信号识别研究的训练样本和检验样本。针对汉语孤立词的语音识别，将人工神经网络中最经典最常用的神经网络模型——BP网络应用于语音识别，尽管它可以得到较高的识别精度，但训练速度慢是它的致命弱点，无法实现语音信号的实时处理。因此，针对经典BP算法速度慢的缺点，应用若干旨在提高网络训练速度的改进算法对BP网络加以改进，最后提出一种混合语音识别模型——时间归整神经网络加BP网络分类模型。这种模型综合了传统识别方法的时间归整思想，同时很好地利用了神经网络用于模式识别的各种优越性能。语音识别系统的设计框图如图1。图1 采用人工神经网络技术进行语音识别的过程包含两部分：一是网络学习过程，二是语音识别过程。网络学习过程是将已知语音信号作为学习样本．通过神经网络的自学习，最终得到一组连接权和偏置；语音识别过程是将待澳0语音信号作为网络输入，通过网络的联想得出识别结果。 1 BP神经网络简介人工神经网络具有与人脑相类似的学习记}乙能力、知识概括能力和输入信息特征的抽取能力，是人脑的一种抽象、简化模型。BP网络是最经典、最常用的一种网络模型，是由非线性变换单元组成的前馈网络。 BP网络通常有—个或多个隐层，隐层中的神经元均采用S型变换函数，输出层的神经元采用纯线}生变换函数。 BP网络主要用于： (1)函数逼近：用输入矢量和相应的输出矢量训练一个网络逼近一个函数； (2)模式识别：用一个特定的输出矢量将它与输入矢量联系起来； (3)分类：把输入矢量以所定义的合适方式进行分类； (4)数据压缩：减少输出矢量维数以便于传输和存储。 BP学习算法是多层前馈神经网络所使用的监控式学习算法。传统方法按照最小均方误差准则，使用梯度搜索技术，以期最小化网络的实际输出和期望输出的均方差，网络的学习过程是一种误差传播修正权值的过程。 BP网络的神经元非线性关系为：圹f(Xj)2南 BP算法的权值修正公式如下： t。(k+1)=瓦(k)+AT,。=瓦(k)+riSkyi ％(≈+1)=啦；(☆)+△％=％(t)+r161y．传统的BP算法在这方面存在一些缺陷，主要表现在： (1)各权值采用相同的步长，不适合窄长峡谷型的误差曲面，梯度最陡下降法会使误差在两壁之间跳来跳去，权值