- 20
- 0
- 约4.08千字
- 约 8页
- 2018-08-18 发布于湖北
- 举报
基于BP神经网络的语音情感识别研究
摘要:随着科技的迅速发展,人机交互越来越受到人们的重视,语音情感识别更是学术界研究的热点。将BP神经网络算法用于语音情感识别研究,并在汉语情感数据集上进行了相关实验,识别的准确率达到了91.5%,相较于SVM算法分类精度提高了5%。
关键词关键词:语音情感识别;BP神经网络;SVM
中图分类号:TP302
文献标识码:A 文章编号文章编号2014)004001103
作者简介作者简介:徐照松(1990-),男,广西师范学院计算机与信息工程学院硕士研究生,研究方向为数据挖掘、语音情感、智能计算;元建(1986-),男,广西师范学院计算机与信息工程学院硕士研究生,研究方向为数据挖掘、智能计算。
0 引言
随着科技的迅速发展,人机交互显得尤为重要。语音是语言的载体,是人与人之间交流的重要媒介。相较于其它交流方式而言,语音交流更加直接、便捷。近年来,随着人机交互研究的不断深入,语音情感识别更成为了学术界研究的热点,其涉及到信号处理、模式识别、人工智能等相关领域。语音中除了能够传达语义信息外,还包含了一些情感信息,然而这些情感信息往往被人们所忽略[3]。语音情感识别实际上是利用计算机所提取的语音信号特征来判断其属于哪一类情感。利用模式识别方法研究语音情感识别的文献较多,朱菊霞[4]等使用SVM算法对语音情感进行识别,并取得了86%的识别率。余华[5]等使用粒子群算法优化神经网络来进行语音情感识别,识别率较高。BP神经网络是神经网络的一种,属于多层前馈神经网络,与其它神经网络算法所不同的是采用了反向传播的学习算法,不断地计算输出端的误差向回传递来进行权值调整,从而达到误差最小的效果。文中结合了BP神经网络的优点,将其用于语音情感识别研究中,并且在汉语情感数据集上进行了相关实验,识别的准确率达到了91.5%,相较于其它方法提高了5%。
1 BP神经网络
BP神经网络算法由Rumelhart[6]等于1988年提出,
它是一种用于前向神经网络学习训练的误差反向传播算法,简称BP算法。它是前向神经网络的核心和精华部分,因其网络结构容易构造,对输入的数据没有特别要求,同时相关理论的研究也已经成熟,因而已经被广泛地应用于模式识别中。目前,人工神经网络中研究最多的就是BP神经网络及其改进算法。该网络同样由输入层、隐含层、输出层组成,典型的BP神经网络如图1所示。
图1 典型的BP神经网络结构
该算法主要由两个阶段组成,分别是正向传播过程和误差的反向传播过程。正向传播过程是指输入特征向量,经过输入层、隐含层和输出层逐层计算权值。误差的反向传播过程是指输出层计算出误差之后,再由输出层传到输入层来进行权值调整。一个标准的BP神经网络流程如图2所示。
图2 BP神经网络流程
(1)正向传播过程。从样本数据集中选择一个样本Xi,将其输入到神经网络,并计算其实际输出Yi。该过程就是数据样本从输入层输入,然后经过隐含层和输出层的逐层计算,得到的输出结果。
(2)误差的反向传播过程。计算实际输出Yi与理想的输出结果Ai之间的误差,根据相应的规则不断地调整权值,并对BP神经网络进行不断训练使得误差能够满足要求。
2 语音情感特征
如何选择有效的语音情感特征,直接影响到语音情感识别结果的好坏。首先要明确研究哪几类情感,从心理学的角度来看,总共包括以下7类情感,即高兴、生气、悲伤、害怕、惊讶、厌恶、中性。本文主要研究生气、高兴、悲伤和惊讶这四类情感。目前,很多研究中都是把语音情感识别问题转化为模式识别问题进行研究。其本质就是先对语音信号特征进行预处理,再提取相关特征,从而进行分类。选取语音持续时间、短时能量、基音频率、共振峰和MFCC等语音信号特征进行相关研究。
2.1 语音持续时间
语音持续时间实际上就是说话过程中所持续的时间,其往往与所表达的情感有着直接的关联。一般来说,人生气时说话速度较快,语音持续时间较短;而处于悲伤或者害怕时说话的语速就会较慢,语音持续时间较长。因此,选择带有情感的语音持续时间与正常状态下的语音持续时间的比值作为一个特征参数。
2.2 短时能量
短时能量直接反映了声音音量的大小。一般来说,清音的能量较小,浊音的能量较高。当一个人的情感为生气或者是惊讶的时候,其说话的音量就会变大,短时能量往往也比较高。当一个人的情感为害怕或者悲伤的时候,说话的音量就会变低,短时能量往往也比较低。因此,本文选择短时能量的均值、最大值、最小值、变化范围这4个特征参数。
2.3 基音频率
基音频率简称基频,它直接反映了声道的特征,已经在多个领域被广泛应用,如语音识别、语音合成等
您可能关注的文档
- 基于 “战略―系统”思维的特种设备监管模式及体系研究.doc
- 基于.NET的LINQ to SQL 三层架构的研究与实现.doc
- 基于.NET的高校教学督导信息化服务系统设计与实现.doc
- 基于.NET的网络考试系统的设计与开发.doc
- 基于.NET的农作物育种助手软件的研发.doc
- 基于[SVAR]模型的中国货币政策有效性分析.doc
- 基于“MRC”模型的工会文体活动组织模式柔性化研究.doc
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)英语word版含答案.docx
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)语文word版含答案.docx
- 基于“城市触媒理论”的历史片区复兴规划探究.doc
- 广东省肇庆市实验中学2018届高三下学期第8周生物晚练word版含答案.docx
- 基于Brij97液晶的胰岛素皮下注射给药载体制备.doc
- 基于BS架构的高校设备维修管理系统的分析与设计.doc
- 基于BS体系结构思想探索自学考试管理模式浅析.doc
- 广东省肇庆市实验中学2018届高三下学期第13周生物午练word版缺答案.docx
- 基于C#的随机点名系统的设计与实现.doc
- 基于CAN覆盖网的网络配置同步技术.doc
- 广东省肇庆市实验中学2018届高三下学期第14周生物限时训练word版缺答案.docx
- 基于CAN总线的汽车电子控制研究.doc
- 基于CDF97小波和自适应Otsu算法的视频字幕分割.doc
最近下载
- 新疆小额再贷款股份有限公司招聘笔试题库2024.pdf
- 2026年湖南铁道职业技术学院单招职业技能测试题库推荐.docx VIP
- 2025年河南省公务员省考《行测》联考-部分真题(含答案).pdf VIP
- 园林苗圃学苗木的播种繁殖.ppt VIP
- 校服采购服务方案投标文件(技术方案).doc
- 人教版高中英语选择性必修三单元 Unit 1 Art单元话题语法填空练习(含答案).pdf VIP
- 区烟草局下半年工作部署.docx VIP
- 2025年四川省考_选调公务员省考《行测》联考真题(含答案).docx VIP
- 低分子肝素临床应用中国专家共识(2026)解读PPT课件.pptx VIP
- 一致魔芋(839273)魔芋粉行业领军者,魔芋食品成为第二增长曲线.docx VIP
原创力文档

文档评论(0)