微博用户行为模式研究与其应用_北京理工大学_硕士论文毕业答辩_20121221.pptxVIP

微博用户行为模式研究与其应用_北京理工大学_硕士论文毕业答辩_20121221.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
姓名:潘笛 学号:2120101757 专业:管理科学与工程 指导老师:赵燕平、张华平;研究背景;资料来源:徐志明教授,哈尔滨工业大学;?;资料来源:徐志明教授,哈尔滨工业大学;研究意义;研究内容;研究内容;主题1 行为矩阵模型;1. 行为清单;;传统描述方法存在如下不足: 1)部分微博用户在微博平台的行为因每周不同日期、工作日、节假日的影响而表现出差异,而这种差别并不能体现在小时段柱形图之中; 2)该方法仅是对原始数据的单纯求和,缺少对异常数据、离群数据(Outlier)的审视判别与有效处理,而这种离群数据对整体的破坏性又是不容忽视的。;1. 原始求和法;4. 多重响应归一法;行为矩阵生成系统流程图:;;;;第一主成分 (原始数据);实证研究 研究对象:个体,uid为1922397344 数据集:2011年03月14日至2011年10月16日的3,019条微博 时间颗粒度:60分钟 研究行为:发布行为 数据处理器:原始求和法;;研究内容;主题2 关联模式挖掘;1. 概念引入;针对于数据库数据,计算条件频率F(A|B)时有:;当A为空集时,也即P(A)、Count(A)均为零值时,有:;Day;Day;2. 扬抑系数(RS-Coefficient);为了定量化测度这种 促进 与 抑制 的程度 本课题提出扬抑净值δ,其所表征的意义即为条件概率与概率间的净差值,其计算公式如下::;0;上述实际情况,促使本课题进一步提出用以表征扬抑程度的测度方法,也即扬抑系数rRS,其公式为:;;;3. 热图及其算法;;4. 系统流程;5. 实证研究;该用户群体扬抑热图主对角线显著泛红;说明其在相邻时段见行为相互促进 第1、2、3、4时段,分别对其之后第6个时段(即7、8、9、10)存在显著抑制规律,反向规律同样存在;第24时段对于第5、6、7时段存在显著抑制规律;反向规律也存在 图中左下有一片空白区域,也即第12至21时段的行为,对3、4、5、6时段的行为无显著促进与抑制作用;群体研究: 时间颗粒度:30分钟 着色系数 :k=0.7;群体研究: 时间颗粒度:15分钟 着色系数 :k=0.7;群体研究: 时间颗粒度:60分钟 着色系数 :k=0.7 研究对象单位:单周;该用户扬抑热图主对角线显著泛红;说明其在相邻时段见行为相互促进; 图中上侧和左侧有两片显著蓝色区域,代表较为行为抑制现象;也即该用户1~5时段内产生发布行为,对其余时段存在抑制现象;反之亦然;该现象可以解释为休眠时段与非休眠时段间的互相抑制现象 图中右下角存在显著红色区域;说明该用户在第10至21时段的行为,有内部促进现象;研究内容;主题3 演化模式挖掘;1. 行为演化模式介绍;;因此,本章的研究重点在于: 1)用户行为状态是否存在潜在的演化模式 2)如果存在演化模式,该以何种方式定量化描述 3)该定量化描述方法的优度该如何验证;2. 系统设计;针对于用户行为状态值的识别,可采用前文提及的二进制状态值赋值法来解决。在处理得到结构化表格后,需要: 1)依据用户标识(uid)分组; 2)并在组内以时间升序排列。;;3. 实证研究;将该向量进行归一化处理后,即可得到该演化模式的极限分布,也即稳态向量;通过测度“观测频数”与“期望频数”间差异,可对拟合优度进行测算。 如表中右下角所示,其卡方值为13.23147,在自由度为15的卡方分布下,其分布右尾概率为0.584424833,说明实际分布情况已经一定程度上接近理论值,趋于稳态。;研究内容;主题4 行为分布规律;1. 相关理论;2. 实证研究;由该图可见,用户频数随着观测时期内微博发布行为频数的增多而剧减 显然,这种陡峭的变化近乎完全不符合正态分布的钟形曲线,这也预示着其他行为分布规律与模式的存在;将前x,y轴数值同时取对数后得到下图;观察该散点图可发现较为显著的线性趋势,进行线性回归分析有:;;经实证研究,本课题发现了微博用户的多种行为均表现出的较为显著的幂律性,其幂律系数均集中于0.84~1.15 针对于众多领域所呈现的幂律性,前人提出了几种机制,包括增长与优先连接、自组织临界、HOT理论、渗流模型及一些随机过程等,这些理论能否解释微博用户行为幂律性,也将是进一步深入研究的内容;总结与展望;后续研究,可以进一步结合人口统计学指标,对不同分类体系下用户的行为模式进行差异性研究;例如可以对比北京与上海、男性与女性等不同用户群体在特定行为模式下的差异,从而得到具备宏观意义的结论 同时,进一步将用户人格特征与行为模式进行关联分析和探索。这是因为人格是衡量个体差异最有效的变量之一,是个体稳定的行为模式和反应倾向,具有跨时间和跨情景的稳定性;人格也是影响个体行为的一个重要变量 本次限于研究工作

文档评论(0)

189****6140 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档