语音情感识别研究.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

表达自身的情绪。不同语言表达的情感有不同的情感特征,但某种情况下也存在

相似的情感特征。该研究从预处理、预加重、分帧与加窗、端点检测技术等方面

对语音情感识别进行了综述,目的利用这部分驱动模型学习,获得情感判别性,

提升语音情感识别的泛化性。

关键词:情感特征;预处理;分帧与加窗;情感判别性

Researchonspeechemotionrecognition

ZHOURong-jinLINWei-chang

NanjingUniversityofTechnologyPujiangCollege,SchoolofComputer

andCommunicationEngineering,NanjingJiangsu,211200)

Abstract:Speechisthemostdirectwayofhumancommunication.In

theprocessofcommunicationbetweenpeople,Speechcanexpresstheir

emotions.Emotionsexpressedindifferentlanguageshavedifferent

emotionalcharacteristics,butinsomecases,therearealsosimilar

emotionalcharacteristics.Thisresearchsummarizesspeechemotion

recognitionfromtheaspectsofpreprocessing,preemphasis,framing

andwindowing,endpointdetectiontechnologyandsoon.Thepurposeis

tousethisparttodrivemodellearning,obtainemotion

discriminationandimprovethegeneralizationofspeechemotion

recognition.

Keywords:Emotionalcharacteristics;Pretreatment;Framingand

windowing;Emotionaldiscrimination

1概述

感知和理解人类的情绪状态。人的情绪状态通常可通过语音、表情、动作等行为

信号反应出来,其中语音信号是一种日常生活中最为常见的情绪信号。因此,基

于语音信号我们可以准确地分析出人的实时情绪状态。如此,我们可以设计一系

列算法,使机器拥有足够的智能,能够从说话人的语音信号中识别出说话人的情

绪状态(如高兴,悲伤,惊吓等)。这便是当前情感计算和人工智能领域作

[[1]]

为火热的研究内容之一——语音情感识别。语音情感识别的研究具有非常重大

的实用价值,通过分析观众的情感状态,可以使交互式电影的应用更加实用。

语音信号通过采集为数字化的时间序列进入计算机进行预处理,将每一帧预

处理后的语音信号提取成一个特征向量,构成语音识别样本,对样本的识别由分

类器来实现,分类器包含两个工作阶段:设计阶段与决策阶段。在设计阶段,用

大量已知的语音信号来确定分类器模型中的参数;在决策阶段,未知语音信号经

过与设计阶段同样的预处理后进入训练好的分类器,最终识别结果[[2]]。

2语音情感识别研究

2.1语音信号的预处理技术

数据库[[3]]中的语音信号绝大部分是以初始音频文件呈现,为了减少实验中

不必要的冗余或干扰,语音信号在采集过程会尽量控制采集环境的分贝频率、电

磁干扰等因素,从采集源头获得相对“纯净”的音频。作为一种非平稳的时变信

号,语音信号蕴含了多种可供研究的信息,掌握这些语音信息可进行语音合成、

语音识别等操作。实现这些处理的前提是必须将语音信息中的特征参数提取出来,

提取的特征参数为了保证其可靠性需要对语音信号进行一系列预处理,在不破坏

其信息的前提下,对语音中存在的冗余项进

文档评论(0)

138****5496 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档