- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
万方数据
万方数据
RESEARCH ON EMOTION RECOGNITION BASED ON SPEECH AND FACIAL EXPRESSION
A Doctor Dissertation Submitted to
University of Electronic Science and Technology of China
Major: Communication and Information Systems Author: ZHANG Shiqing Advisor: Prof. LI Lemin
School: School of Communication and Information Engineering
独 创 性 声 明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。
作者签名: 日期: 年 月 日
论 文 使 用 授 权
本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后应遵守此规定)
作者签名: 导师签名:
日期: 年 月 日
摘 要
摘 要
情感识别是情感计算领域中的一个重要分支,是当前信号处理、模式识别、 人工智能、人机交互等领域的研究热点。由于情感识别是一个多学科交叉的复杂 研究课题,尚存在诸多问题有待解决,尤其在特征提取、特征降维、识别方法以 及多模态情感信息融合等方面还有待更深入地研究。
情感语音和人脸表情是人类表达情感的最主要的两种方式。本论文正是针对 基于情感语音和人脸表情的情感识别方面的关键技术做了探索,提出了若干改进 算法应用于情感识别。本论文的主要内容为:
1.综述了语音情感识别和人脸表情识别两个方面的研究历史及现状,概述了 其中的重点和难点,如情感数据库、情感特征提取与降维、以及情感的分类算法 等。
2.研究适用于语音情感特征数据的非线性降维算法,给出一种改进的监督局 部线性嵌入(Improved-SLLE)算法。为了克服 SLLE 算法的不足,提出一种能够 提高 SLLE 算法所产生的低维嵌入数据的判别力,并具备最优泛化能力的改进 SLLE 算法。该算法对提取的语音韵律特征和音质特征作非线性降维处理,从而在 低维的嵌入特征空间里实现语音情感识别性能的改善。
3.研究适用于语音情感特征数据的基于核思想的非线性降维算法,提出一种 核判别局部线性嵌入(KDLLE)算法。为了融合核方法和局部线性嵌入(LLE) 算法,通过设计一个核判别距离,并在再生核 Hilbcrt 空间(RKHS)上实现重构 误差的最小化,从而提出一种具有判别性质的核判别局部线性嵌入算法。该算法 用于语音情感特征数据的非线性降维,不仅取得了比 LLE 更好的低维可视化效果, 而且也表现出优越的语音情感识别性能。
4.研究语音情感的连续性动态变化的跟踪技术,提出一种基于“激发维-效价 维-控制维(AVD)”三维连续空间模型的语音情感估计方法。根据情感维度表示理 论,情感可定义为三维连续空间模型(AVD)上的坐标点。每个 AVD 坐标点就可 以唯一地标识某一种离散的情感类型。通过采用回归方法对情感语音的 AVD 坐标 值的连续性变化进行预测估计,从而将针对离散情感的语音情感识别问题转化为 针对连续性情感变化的语音情感估计问题,以便达到对语音情感表达的连续性动 态变化进行追踪的目的。
I
摘 要
5.研究基于压缩感知理论的鲁棒性人脸表情识别技术,给出一种基于稀疏表
示的人脸表情识别新方法。首先对要识别的受到腐蚀或遮挡的测试样本表情图像 寻求其稀疏表示,然后采用压缩感知理论求解其最稀疏的解,最后根据所求取的 最稀疏解信息进行表情分类。在提取原始像素、局部二元模式(LBP)与 Gabor 小波三种人脸表情特征之后,该方法可用于实现鲁棒性的人脸表情识别。实验结 果表明,该方法不仅具有优越的人脸表情分类性能,而且表现出良好的鲁棒性。
6.研究融合语音和人脸的多模态情感识别机制。首先分别提取能够反映情感 语音和人脸表情的特征参数,然后采用两种多模态信息融合策略:特征层融合和 决策层融合,用于实现多模
您可能关注的文档
- 基于心音信号身份识别算法的研究-控制理论与控制工程专业论文.docx
- 基于形状特征的高分辨率遥感影像目标识别分析-地图学与地理信息系统专业论文.docx
- 基于图像处理技术的条形码识别系统的研究-工业工程专业论文.docx
- 基于知识管理的政府投资项目后评价改进分析-管理科学与工程专业论文.docx
- 基于知识整合的数据流分类算法研究-计算机软件与理论专业论文.docx
- 基于指纹识别的医院管理信息系统的设计与实现-软件工程专业论文.docx
- 基于体裁的金融网页自动分类方法计算机科学与技术专业论文.docx
- 基于指标气体变化规律的煤氧化自燃预报实验研究-安全管理工程专业论文.docx
- 基于移动支付的空中充值系统设计开发与应用-软件工程专业论文.docx
- 基于小波识别的多模式接收机技术研究-通信与信息系统专业论文.docx
- 基于液固压缩技术葛根总黄酮速释片的研究-药剂学专业论文.docx
- 基于证据理论的多源信息融合技术研究与应用-计算机科学与技术专业论文.docx
- 基于摘要的视频内容检索系统-信号与信息处理专业论文.docx
- 基于现场交接试验的高压电缆交流耐压及局放技术应用研究-电气工程专业论文.docx
- 基于知识重用的HDD履带行走装置快速设计系统研发-机械工程专业论文.docx
- 基于悬丝位移光电传感技术的桥梁动挠度检测-智能交通与信息系统工程专业论文.docx
- 基于虚拟仪器的励磁系统故障诊断的研究-控制科学与工程专业论文.docx
- 基于小波变换的无链表SPIHT图像编码算法研究-计算机应用技术专业论文.docx
- 基于形态成分分析的语音活动检测-计算机技术专业论文.docx
- 基于危险源理论煤矿瓦斯灾害监测预警技术及其应用研究-矿业工程专业论文.docx
文档评论(0)