- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于智能手机用户情感识别与调节模型研究
基于智能手机用户情感识别与调节模型研究
摘 要 智能手机的使用既给人们带来了巨大的自由与快乐,也造成了人们对于手机的依赖与孤独感。有鉴于此,为了减少用户在使用手机的过程中的情感孤独,研究提出一种基于智能手机情感识别与调节的模型。
关键词 手机 情感 调节
中图分类号:TP399 文献标识码:A
手机作为“准第五媒?w”,已经越来越多地融入到人们的日常生活。但是,手机的使用越来越使的人们变得孤独。为了使手机能够更好的服务于大众,我们提出一种基于智能手机情感识别与调节模型。利用手机使用过程中对人们语气、语速、某种感情色彩的词汇使用频率的检测,通过对应的数据匹配,从而高概率的判定手机用户当下的心情指数,通过对心情指数的直观识别,智能手机为用户提供人文关怀,如可以通过发送一些对应心情的图片、一些表示安慰或激励的句子,最终实现模型的目的。
1情感概述与人脸识别
情感是人对客观事物是否满足自己的需要而产生的态度体验。情绪感受有喜、怒、忧、思、悲、恐、惊等。情绪不同时人的面部、声音等会有不同的表现。
人脸表情识别 (facial expression recognition,FER)中 感情表露=7 %的言词+38%的声音+55%的面部表情。在智能手机中,我们可以采取下面的步骤, 建立一个FER系统,首先需要对人脸进行检测与定位;其次从人脸图像或图像序列中提取能够表征输入表情本质的信息,在提取特征数据的过程中,需要特征降维、特征分解等进一步处理;最后分析特征之间的关系,将输入的人脸表情分类到相应的基本情感类别。在此,表情特征提取的方法是FER系统中最重要的部分,好的表情特征提取结果应该具备一下几个条件:
(1)完整的表示出人脸表情的本质特征;
(2)去除噪声、光照及其他与表情无关的干扰信息;
(3)数据表示形式紧凑,避免过高的维数;
(4)不同类别表情的特征之间有较好的区分性。
表情特征提取的步骤如下:
利用某种形式的信息来获得表情的原始特征,如特征形状与几何关系,局部纹理,光流场等,这一步骤成为原始特征获取。这些原始特征一般都存在信息冗余,维数过高,区分性不够等问题。所以需要对原始特征数据进行一些后处理,如特征降维和提取,特征分解等,以降低维数,去除干扰因素,得到对分类更为有利的特征数据。
常用的方法有:主元分析(PCA),线性判别分析(LDA),ICA等。
(1)PCA提取了最有代表性的特征,可以有效地消除冗余,降低维数,但没有考虑不同类别数据之间的区分性。
(2) LDA通过最大化数据的类间离散度和最小化类内离散度来选择合适的投影方向,侧重于寻找具有最大分辨力的方向。
(3) 适用最广泛的是CMU的Cohn-Kanade数据库,算法比较标准。另外日本ATR的女性表情数据库(JAFFE)也得到较多适用。
某些表情易于识别,而某些表情不易识别,心理学方面的研究认为,最容易辨认的表情是快乐、痛苦,较难辨认的是恐惧、悲哀,更难辨认的是怀疑、怜悯,在FER系统中也面临着对某些类别的表情识别率偏低的情况。
目前的研究大多数都针对特定条件下采集的图像或者图像序列,但要做到对任意采集的图像或图像序列都不适应,还需要人脸检测等其他领域的发展。
2语音识别
语音识别主要包括以下内容:
2.1发音长度
通常,欢快、愤怒、惊奇的发音长度较短,平静发音长度居中,而悲伤的发音长度则稍长。
2.2语速
(1)从语速上看,欢快、愤怒、惊奇的语速较快,平静发音相语速居中,而悲伤则较慢。
(2)对于汉语而言,一个汉字即为一个音节,所以用总音节数除以持续时间即得到语速。
2.3音量
语音作为一种能量有限的信号,音量特征是其最重要的特征之一。 从人们的直观感觉中就可感受到语音信号的音量特征与情感具有较强的相关性,如当人们愤怒时,发音的音量往往变大;而悲伤时,往往声音较低。
在语音识别环节主要包括:预处理、特征提取和情感分类。
2.3.1预处理
主要包括采样量化、预加重、端点检测、分帧加窗。
2.3.2 特征提取
特征提取的任务是从输入的语音信号中提取能够区分不同情感的参数序列。
2.3.3模式分类
(1)在训练时用反映情感特征的参数序列,为每种情感建立相应的情感模型。
(2)在测试或识别时根据所得到的待识别语音信号的特征参数序列,由系统对这些参数和已知情感模型之间的相似程度进行评估,并根据评估的结果判断输入语音信号的情感归属通过前面的处理以后,选择合适的算法也是一项重要工作,当前比较流行的算法有基于概率生成模型的方法和基于判别模型的方法两种。分别对应隐马尔可夫
文档评论(0)