BP神经网络在汉语数字语音识别中应用.pdfVIP

下载本文档

22
0
约7.15千字
约 3页
2015-09-30 发布于安徽
举报
版权申诉

BP神经网络在汉语数字语音识别中应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第33 卷第3 期广西物理 GUANGXI PHYSICS Vol.33 No.3 2012 * BP 神经网络在汉语数字语音识别中的应用 † 罗梅，江丽莎，罗涟玲 (广西师范大学计算机科学与信息工程学院，广西桂林 541004) 摘要：从语音信号产生的数字模型出发，对1～10这10个汉语数字的语音信号进行预处理，提取了Mel频率倒谱系数，并将特征参数序列进行非线性时间规整为固定的帧数，使用BP神经网络的训练和识别，研究该方法的可行性和有效性。结果表明，在噪声环境下1,7,9的识别率为80%，而2,3,4,5,6,8,10的识别率都是100%，识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点，可应用于语音识别系统。关键词：汉语数字语音识别；Mel 频率倒谱系数；非线性时间规整；BP 神经网络中图分类号：TP311 文献标识码：A 文章编号：1003-7551(2012)03-0026-03 1 引言汉语数字语音识别[1-3]是语音识别中的一个重要分支，其在现实生活中的应用十分广泛，如在电话语音拨号、门禁系统、身份证号码确认等领域都有着重要的应用。BP 神经网络[4-6]是目前应用最广泛的神经网络，它是由大量计算单元通过丰富的连接构成的复杂网络，可以实现输入与输出之间构成的任意线性映射，在函数逼近、模式识别等领域也有着很重要的应用。因此，从语音信号产生的数字模型出发，对 1～10 这 10 个汉语数字的语音信号进行预处理，提取了 Mel 频率倒谱系数，并将特征参数序列进行非线性时间规整为固定的帧数，使用 BP 神经网络的训练和识别，研究该方法的可行性和有效性。 2 汉语数字语音特征参数的提取 2.1 语音信号的预处理和端点检测为了去除口唇辐射的影响，增加语音的高频分辨率，通常需要对输入的语音信号进行预加重，也就是对语音的高频部分进行预加重处理，而这个处理过程可由相关的数字滤波器来实现。语音端点检测就是从包含语音的一段信号中确定出起始点和终点，正确的端点检测可以使采集的数据真正是语音信号的数据，从而减少数据量和运算量并缩短处理时间。常用的端点检测方法有很多种：能量阈值、基音检测、倒谱分析等，其 [7] 中最常用的是基于短时能量和过零率的双门限判决法。将该方法运用到汉语数字语音的端点检测中，能够很好地找到语音的端点位置。 2.2 特征参数的提取语音特征参数的提取是指从语音信号中获取一组能够描述语音信号特征参数的过程。在理想情况下，这些特征应该具有以下特点：保持相对稳定、不易被模仿、尽量不随时间和空间变化等。由于人的听觉系统是一个比较特殊的非线性系统，它对于不同频率信号响应的灵敏度不同，基本上是一个对数的关系。而 Mel 频率倒谱系数 (MFCC)参数就是一种能充分利用人耳感知特性的参数，能很好地描述人耳对汉语语音音调的感知情况，具有良好的识别能力和抗噪能力，所以在目前的语音识别领域极为常用。实验中将语音信号的 MFCC 参数作为识别的特征参数。提取步骤如下： (1）首先将按预加重处理后的信号s(n) 进行分帧，对每帧序列s(n) 进行离散 FFT 变换，一般取N 256 ，再经过取模的平方得到功率谱S(n) 。 (2）计算s(n) 通过M 个h (n) （Mel 频率滤波器组）后得到的功率值，即计算s(n) 和