神经网络语音信号识别与特征值提取的研究.pdfVIP

神经网络语音信号识别与特征值提取的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
神经网络语音信号识别与特征值 提取的研究 刘剑1,崔远慧1,成川2 (1.大连轻工业学院信息科学与工程学院2大连海事大学航海学院) 亟 摘要:(针对语音信号的实时处理问题,利用神经网络用于模式识别的优越性,提出一种 混合语音识别模型——时间规整神经网络加BP网络分类模型,、对特定人和非特定人的 孤立词的特征值进行提取;在时域中采用短时过零分析和幅值概率分析,在频域中采用 功率谱密度、快速傅里叶变换、线性预测系数的方法提取特征参数,通过实验进一步改 进特征提取的算法,并加以比较可知时域的特征提取方法不能迭到语音识别的要求,而 频域的方法提取的特征样本经BP神经网络语音识别摸型训练,基本满足语音识到的要 求。 关键词:语音信号识别;特征值提取;神经网络 0引 言 以数字信号处理技术为基础的语音信号处理是一门新兴的交叉学科。随着社会的不断发 展,计算机的迅速普及,人们渴望一种符合人类自然交往的“人机对话”模式的出现,特别 是人机自然语言对话。目前一些专家和学者在这方面进行了大量的开发和研究工作。但语音 识别技术正处于蓬勃发展的时期,仍有待进行大量的研究工作以取得更进一步的突破。 语音识别的关键技术包括特征参数提取技术、模式匹配准则及模式训练技术等,而要提 高语音识别的识别率,提取合适的特征参数是前提。如何提取合适的特征参数,为基于神经 网络的语音识别提供样本,可考虑的方法如下: (1)采用时域特征参数,如短时过零分析和幅值概率分析; (2)采用频域特征参数,如功率谱密度、快速傅里叶变换和线性预测系数。 将所提取的特征参数进行比较分析,选择合适的n组参数,作为人工神经网络语音信号 识别研究的训练样本和检验样本。针对汉语孤立词的语音识别,将人工神经网络中最经典最 常用的神经网络模型——BP网络应用于语音识别,尽管它可以得到较高的识别精度,但训练 速度慢是它的致命弱点,无法实现语音信号的实时处理。因此,针对经典BP算法速度慢的 缺点,应用若干旨在提高网络训练速度的改进算法对BP网络加以改进,最后提出一种混合 语音识别模型——时间归整神经网络加BP网络分类模型。这种模型综合了传统识别方法的 时间归整思想,同时很好地利用了神经网络用于模式识别的各种优越性能。 语音识别系统的设计框图如图1。 图1 采用人工神经网络技术进行语音识别的过程包含两部分:一是网络学习过程,二是语 音识别过程。网络学习过程是将已知语音信号作为学习样本.通过神经网络的自学习,最终 得到一组连接权和偏置;语音识别过程是将待澳0语音信号作为网络输入,通过网络的联想得 出识别结果。 1 BP神经网络简介 人工神经网络具有与人脑相类似的学习记}乙能力、知识概括能力和输入信息特征的抽 取能力,是人脑的一种抽象、简化模型。BP网络是最经典、最常用的一种网络模型,是由非 线性变换单元组成的前馈网络。 BP网络通常有—个或多个隐层,隐层中的神经元均采用S型变换函数,输出层的神经 元采用纯线}生变换函数。 BP网络主要用于: (1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数; (2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来; (3)分类:把输入矢量以所定义的合适方式进行分类; (4)数据压缩:减少输出矢量维数以便于传输和存储。 BP学习算法是多层前馈神经网络所使用的监控式学习算法。传统方法按照最小均方误 差准则,使用梯度搜索技术,以期最小化网络的实际输出和期望输出的均方差,网络的学习 过程是一种误差传播修正权值的过程。 BP网络的神经元非线性关系为: 圹f(Xj)2南 BP算法的权值修正公式如下: t。(k+1)=瓦(k)+AT,。=瓦(k)+riSkyi %(≈+1)=啦;(☆)+△%=%(t)+r161y. 传统的BP算法在这方面存在一些缺陷,主要表现在: (1)各权值采用相同的步长,不适合窄长峡谷型的误差曲面,梯度最陡下降法会使误差 在两壁之间跳来跳去,权值

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档