- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MoodCast模型的用户行为分析与预测
摘 要: 心理学研究表明人类行为受其情感的影响,鉴于社交网络中对用户行为的分析未考虑到情感传播因素的影响问题,本文基于动态因子图模型(MoodCast)在情感分析中预测准确率较高的特点,将其应用于社交网络的行为分析中,给出了一种新的情感预测模型,并将该模型运用到广告点击用户行为分析中。实验仿真结果验证了用户情感与社会关系因素及时间因素相关,用户情感与行为呈正相关。0 引言情感是人类对客观外界事物态度的体验,人们在社交网络中的行为直接反映其在真实世界中的活动和情感。这促使传统意义上的主观心理学概念的情感在网络空间和人类社会中显现出一致性、通用性和重要性,成为影响人类个体、社会及网络社会智能活动的重要因素。目前大部分系统只是支持网络宏观分析(如网络结构分析和可视化分析),而对网络微观分析(如个体用户行为分析、影响力分析等)却鲜有研究。情感动态分析目前主要研究集中在心理学和社会学领域,重点关注人类情感的动因,包括某种具体的情感是如何演化形成、情感随时间的动态变化、或者朋友们之间的情感如何相互影响[3]。文献[6]研究了幸福感在社交网络中的动态传播,揭示了在社交网络中,幸福感最多通过三层联系在人群中进行传播。文献[7]在此基础上对孤独感的动因进行了更进一步的研究,指出在社交网络中孤独感有着和幸福感相似的传播模式。但这些工作中的绝大部分只定性地在一定规模的社交网络数据上进行统计分析及测试验证,缺乏对社交网络情感及其动态演变的定量计算。为此,本文将用户情感传播因素应用到社交网络中,研究情感主观范畴与网络行为有机相融合的计算建模问题,为准确度量人类的情感提供新的技术途径。1 基于MoodCast模型的情感分析与预测动态因子图情感预测模型(Emotion Prediction via Dynamic Continuous Factor Graph Model,MoodCast)是由清华大学教授唐杰提出,主要用于定量计算社交网络中用户的情感以及分析预测其行为分析。MoodCast是结合用户的动态状态信息(如地点、活动和属性)和用户的社会关系对其情感的影响而建立的模型。MoodCast中将主体情绪的变化建模成动态连续网络Gt的函数:Gt=(V,Et,Xt,Yt)。其中V是用户的集合,假设有n个用户,e∈Et是指在t时刻用户vi和用户vj创建的连接。Xt是社交网络上所有用户在连续时间属性变化的集合,Yt是在社交网络上所有用户情感状态改变的集合。假设用户所处环境不变,即Xt=X[3],则用户的情绪仅根据时间关联因子函数和社会关联因子函数而变化,所以用户的情绪可以表述为式(1):其中,h(Gt)为时间关联因子函数,它表示用户的最近过去时刻t′情感状态yt′对时刻t的情感状态yt的影响程度。由于时间影响具有连续性,即t时刻前的m个时刻为t-1,t-2,…,t-m,根据MoodCast模型,之前状态的时隔越短对情绪预测的影响越深刻,因此预测情感的变量主要是最近的过去状态,归一化过去各时间的影响总和,如式(2)所示:g(Gt)为社会关联因子函数,它表示用户vj在t′时刻的情感y对用户vi在t时刻情感的影响。Fowle、Whitfield和Christakis研究发现一个社会网络中用户传播幸福三度分离,即三度之内用户比之外感到幸福的可能性更大,用户的情绪影响只在两阶内比较显著,且影响因子的系数分别为18%、11%[6]。研究中忽略主体之间联系的密切度,二值化为一阶社交网络用户间联系矩阵E(dij),dij=0 i和j没有联系1 i和j有联系矩阵E(dij)平方后得二阶社交网络用户间联系矩阵E2(eij),eij=0 i和j没有二阶联系1 i和j有二阶联系(是“朋友的朋友”)社会关系方面研究社交网络中其他用户vj对用户vi的影响,而主对角线为自身对自身的影响,所以联系矩阵的主对角线为0。社交网络用户有多个联系人,我们对En×n进行列标准化如式(3)所示:假设用户情绪是自身情绪在时间上的延续及社交关系对用户情绪影响的和,则形式上用户情感状态的预测函数表示为:f(V,Et+1,Xt+1|Gt)→Yt+12 基于情感传播的用户广告点击行为预测模型由于广告是短文本,特征向量表示会异常稀疏,广告文本去除停用词后剩余更少,所以通过经验点击率将剩余文本中的关键词作为广告标签。设词t在M条广告中出现的次数为N(t),则t平均在每条广告中出现N(t)|M次。设t在一条广告a中出现的次数为n(t,a),则t在广告a的重要性如式(8):g(t,a)1,与N(t)呈负相关,与n(t,a)呈正相关(即词t在广告a中出现次数越多越重要)。广告a中的所有词为ti(i=1,2,…,n),让ti按其比重g(t,a)排序,得到词序列t(ki∈{
原创力文档


文档评论(0)