基于PSO―BP神经网络语音识别研究.docVIP

下载本文档

5
0
约3.41千字
约 8页
2018-08-28 发布于福建
举报
版权申诉

基于PSO―BP神经网络语音识别研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于PSO―BP神经网络语音识别研究

基于PSO―BP神经网络语音识别研究　　摘要：针对应用传统BP神经网络在语音识别中训练速度慢、容易陷入局部最优解的问题。该文提出了基于粒子群优化算法的BP神经网络语音识别模型。首先对不同噪声条件和词汇量下的语音样本进行特征提取，然后利用PSO算法对BP神经网络输出权值和阈值参数进行优化，最后利用获得的PSO-BP模型对不同词汇量下的语音样本进行测试。实验结果表明PSO-BP模型对语音的识别率明显高于未经参数优化的BP神经网络分类器，并且对高噪声具有更好的鲁棒性。　　关键词：语音识别；BP神?网络；粒子群算法；参数优化　　中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2018）01-0187-02 　　1 概述　　语音识别是基于语音信号处理和模式识别技术下产生的一种能够实现人机交互的关键技术[1]。语音识别技术能够实现机器对人类的语言信息的识别、基本理解以及做出相应动作响应。目前，语音识别技术已经在医疗机器人、国防、家庭服务等领域得到广泛应用。随着计算机技术的发展，语音识别研究进一步走向深入，具有代表性的是以HMM模型和人工神经网络（ANN）在语音识别中的成功应用。滕云等[2]比较了循环神经网络以及多层感知器在语音识别中的准确性问题。夏妍妍等[3]提出了一种基于RBF神经网络的语音识别方法，但是此种方法训练速度较慢。杨景花等[4]提出一种人工智能和神经网络技术相结合的语音识别方法，该方法主要通过学习的方法对神经网络模型的权重进行求取，以达到较好的识别效果。斯芸芸等[5]利用遗传算法对小波神经网络的参数进行优化，不仅缩短了对语音的识别时间，还提高了网络训练速度和语音的识别率。以上研究均通过神经网络对语音进行识别，但是采用常规BP神经网络进行训练时，常会出现网络早熟、训练时间过长等问题，限制了其在语音识别实际中的应用范围。BP神经网络的参数对其性能有重要的影响，本文利用PSO算法的全局所及搜索以及局部细致搜索的能力，对BP神经网络的参数进行优化。利用所获得PSO-BP模型，应用在语音识别问题中，通过实验证证明了本文所提方法能够提高网络的训练速度以及识别率。　　2 基本算法　　2.1 BP神经网络　　BP 神经网络是一种多层前馈神经网络，其结构包括输入层、输出层以及隐含层。BP 神经网络通过梯度下降法对权值和阈值经行不断地调整，使得最终得到网络模型的实际输出值和期望输出值的均方误差值最小。其训练过程包括以下步骤：　　a）对网络经行初始化。这包括确定网络输入层节点数n、隐含层节点数l、输出层节点数m，输入层与隐含层、隐含层与输出层神经元之间的连接权值ωij，ω’jk，隐含层阈值α，输出层阈值b。　　b）隐含层输出hj的计算。　　e）阈值更新。根据网络输出和期望输出，对aj和bk进行更新。　　f）判断算法是否满足性能要求，若没有满足则返回步骤（b）继续迭代。　　2.2 粒子群优化算法　　粒子群优化（Particle Swarm Optimization， PSO）算法是一种仿生优化算法。PSO算法中每个粒子知道自己的位置方向和距离最优解最近的粒子的位置，在搜索过程中，动态调整粒子位置和速度，直到找到全局最优解。每个粒子由本身的位置向量pi和速度向量vi表示，这些粒子可以记住它们在运动过程中的局部最优位置p*i和整个粒子群的全局最优位置p*g，粒子的速度和位置通过迭代进行更新，如下式所示：　　其中ω是惯性因子，该参数随着更新代数的增长而逐渐降低，c1是用于调整粒子自身经验的学习因子，c2是用于调整粒子社会经验的学习因子，两个参数均为正数。r1和r2在[0， 1]内均匀取值，用来保持粒子的多样性。当新一代粒子产生后，需要计算并且同时更新粒子的适应度函数f （x），粒子的局部最优位置p*i（t+1）按式（8）。同时需要考虑更新整个粒子群的全局最优位置p*g。　　2.3 粒子群优化BP神经网络参数　　通过PSO算法，能够得到使BP神经网络误差最小的权值和阈值的最优值，用于BP神经网络的训练和识别。PSO 优化BP神经网络主要包括种群初始化、寻找初始极值、迭代寻优等操作，其具体步骤为：　　a）初始化BP神经网络的权值和阈值；设置粒子群参数，包括种群规模、迭代次数、惯性因子等；　　b）初始化所有粒子的速度和位置并计算样本中每个粒子对应的适应度值；对粒子的速度和位置进行更新；　　c）直到满足迭代条件，利用输出的权值和阈值对BP神经网络进行训练。　　3 实验方法及结果分析　　3.1 实验数据及特征　　本文的实验数据为孤立词语音库，采样信号频率为11.025kHz，帧长N=256点，帧移M=128点。数据库包含20个人在不同信噪