- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第24卷
第1期应用技术学报Vol.
24
No.
1
2024年
3月JOURNALOFTECHNOLOGYMar.
2024
文章编号:2096-3424(2024)01-0077-08DOI:10.3969/j.issn.2096-3424.2024.01.008
刘云翔,教授,研究生导师。上海应用技术大学计算机科学与信息工程学院党
委书记、学科带头人。主要从事大数据与人工智能、信息融合、自动驾驶V2X
等领域的研究工作。主持和参与国家自然科学基金、上海市科委重大项目、联
盟计划项目、上海市教委项目、吉林省科技厅自然科学基金、武器装备预研项
目和企事业单位委托开发项目20多项。发表学术论文100余篇(其中72篇被
SCI/EI检索),发明专利57项(授权9项),多次在国际会议上做学术报告。近
3年主要为本科生讲授“计算机导论”“程序设计基础”“新技术讲座”“大数据处
理技术”等课程。长期承担本科教学工作,近3年发表教改论文8篇,主编出版
专著《计算机导论》《信息技术基础与应用》《V2X与无人驾驶技术及应用》等10余本,获上海市级教学
成果奖2项、校级教学成果奖4项,主持上海市重点教改项目2项。
双模态跨语料库语音情感识别
刘云翔,
张可欣
(上海应用技术大学
计算机科学与信息工程学院,
上海
201418)
摘要:语音情感识别(SER)在双模态的跨数据库语音情感识别研究较少,跨数据库情感识别过度
减少数据集之间差异的同时,会忽视情感判别能力的特征的问题。YouTube数据集为源数据,互动情
感二元动作捕捉数据库(IEMOCAP)为目标数据。在源数据和目标数据中,Opensmile工具箱用来
提取语音特征,将提取的语音特征输入到CNN和双向长短期记忆网络(BLSTM),来提取更高层次
的特征,文本模态为语音信号的翻译稿。首先双向编码器表示转换器(Bert)把文本信息向量化,
BLSTM提取文本特征,然后设计模态不变损失来形成2种模态的公共表示空间。为了解决跨语料库
的SER问题,通过联合优化线性判别分析(LDA)、最大平均差异(MMD)、图嵌入(GE)和标签
回归(LSR),学习源数据和目标数据的公共子空间。为了保留情绪辨别特征,情感判别损失与
MMD+GE+LDA+LSR相结合。SVM分类器作为迁移公共子空间的最终情感分类,IEMOCAP上的
实验结果表明,此方法优于其他先进的跨语料库和双模态SER.
关键词:跨语料库;情感识别;双模态语音情感识别;迁移子空间学习;循环神经网络
中图分类号:TN912.34;TP18文献标志码:A
Bimodalcross-corpusspeechemotionrecognition
LIU
Yunxiang,
ZHANG
Kexin
(School
of
Computer
Science
and
Information
Engineering,
Shanghai
Institute
of
Technology,
Sh
- 1.ppt制作及优化;2.办公模板制作;3.文案制作及优化。 + 关注
-
实名认证服务提供商
教师资格证、公共营养师持证人
本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。
原创力文档


文档评论(0)