- 78
- 0
- 约5.2千字
- 约 5页
- 2020-12-27 发布于四川
- 举报
精品文档,助力人生,欢迎关注小编!
基于语谱图的老年人语音情感识别方法
摘要:针对老年人的语音情感识别问题,提出一种基于语谱图的老年人语音情感识别方法。首先采用一种改进的基于先验信噪比的维纳滤波算法,针对老人语音情感库EESDB进行语音增强,选取合适的语音情感库,对语音进行语谱图特征提取与规范化,然后分析卷积神经网络(CNN)的结构并选定Cifar10网络对语谱图进行分类,最后采用3种方案进行对比实验。实验结果取得了较高的情感识别率,表明了该方法的有效性和可行性。
关键词:老年人语音情感识别;语谱图;维纳滤波;卷积神经网络
DOIDOI:10.11907/rjdk.181094
中图分类号:TP301
文献标识码:A文章编号文章编号2020)009002804
英文标题Speech Emotion Recognition for the Elderly Based on Spectrogram and CNNs
--副标题
英文作者ZHANG Ruofan,HUANG Jun,GU Lai,XU Ermin,GU Zhixing
英文作者单位(School of Telecommunications and Information Engineering,Chongqing University of Posts and Telecommunication,Chongqing 400065,China)
英文摘要Abstract:To solve the problem of speech emotion recognition for the old people,a method of speech emotion recognition based on spectrogram is proposed.Firstly,the method used an improved Wiener filtering speech enhancement algorithm based on the prior SNR to remove the background noise and enhance the EESDB emotional database,merging the old emotional database EESDB and the Chinese emotional voice database together and extracting the spectrogram feature and standardizing the spectrogram.Then the convolutional neutral network was analyzed and the cifar10 iss chosen for the classification of spectrogram.Finally,the performance of this method was accessed by computer simulations and a higher recognition rates was achieved.The results show that the proposed method in this paper is effective.
英文關键词Key Words:speech emotion recognition for the old people;spectrogram;Wiener filter ;convolutional neutral networks(CNNs)
0引言
情感识别一直是情感计算领域的关注热点,主要通过计算机对用户的生理信号进行分析与处理,得出用户的情感状态。语音作为人类交流最重要的方式之一,不仅能传达丰富的信息,还携带了说话者大量情感因素。因此,如何让计算机自动从语音中识别出说话者的情感状态一直是情感识别领域的研究重点[13]。随着我国人口老龄化的加剧,老年人的养老问题日益突出。语言表达是反映老人精神状态好坏的一个重要方面,关注老人的精神生活状态,首先要关注老年人的语音情感状态。
寻找智能、高效的老年人语音情感识别方法(Speech Emotion Recognition System)是智慧养老的关键问题之一[4]。国内外针对语音情感识别的研究已有20多年历史[5]。20世纪80年代后期,麻省理工大学情感计算研究人员借助采样识别人类情感,并让机器对不同情感作出响应[6]。2020年,美国Picard等[7]证明了声学
原创力文档

文档评论(0)