版主发帖行为实证和聚类研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
版主发帖行为实证和聚类研究

版主发帖行为实证和聚类研究   [摘 要] 为揭示论坛版主发帖的行为模式,编写了网络爬虫软件,获取了天涯论坛92名版主发帖相关数据,并对版主进行了聚类研究。对相关参数,采用极大似然估计法和Kolmogorov-Smirnov检验法进行了分析。结果表明:版主发帖的时间间隔分布符合幂律分布;版主幂律指数、阵发性符合Burr分布,xmin、活跃度符合指数分布;版主聚类为三个类别时,数据蕴含着分形的特征。   [关键词] 论坛;版主;发帖;幂律分布;实证研究;分形   doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016 . 05. 093   [中图分类号] TP391 [文献标识码] A [文章编号] 1673 - 0194(2016)05- 0175- 03   1 前 言   研究个体舆论传播的基本特征是建立群体舆论传播模型的重要基础。从最早的PC互联网时代到当今的移动互联网时代,论坛一直都是舆论传播的重要阵地。由于论坛形成历史时间长,在不同领域中,都已经形成了一定数量的知名论坛。这些知名论坛拥有巨大的用户群,同时也积累了用户发帖相关的大量数据。挖掘这些数据的内在规律,对于认识用户信息传播特征、建立舆论传播模型具有重要意义。   关于人类信息传播行为、论坛舆论传播的研究目前已经有较多成果。最早以Barabási对人类信件的时间间隔分析为起点,研究发现,人类的信息沟通的时间间隔服从幂律分布,并由此创立了人类动力学这门新学科。Vázquez以Barabási的假设为前提,通过严格的数学证明,认为人类动力学中存在着两个普适类,即幂律分布的指数为1或1.5。从此,引发众多的研究者对于人类行为模式进行实证研究。   对于论坛的研究,Yu等对论坛的回帖进行了实证研究。赵永亮等以天涯论坛帖子为对象重点分析了每天发帖量的分布。Qiang等研究了微博社区的兴趣驱动问题。以上这些研究丰富了论坛领域的人类动力学研究。然而,专门对论坛版主研究的文献并不多。   版主是论坛中重要的用户群体。从舆论传播的角度来说,版主往往起到意见领袖的作用。版主通过发布主帖,表达意见,以达到影响舆论、引导舆论的目的。本文利用自己编写的网络爬虫收集了天涯论坛92名版主发帖的相关数据。通过数据分析发现,个体层面:版主发帖的时间间隔符合幂律分布,验证了人类动力学的预测;群体层面:版主幂律指数、阵发性符合burr分布,、活跃度符合指数分布。采用质心距离法对版主聚类分为三类时,数据具有明显的分形特征。   2 数据来源与说明   本文采用的数据是利用自己编写的网络爬虫,定向收集获取的。收集对象是天涯论坛中92名版主发布的主帖数据。时间跨度为2004年1月1日到2015年6月30日,数据量达到6 500 MB。数据精度为分钟。   天涯论坛于1999年3月1日创立,到现在已经超过16年,注册用户9 000万,每月浏览用户超过2亿。选择天涯论坛版主作为研究对象主要基于以下三点思考:一是版主的责任心强,他们主动发帖的概率高于普通用户,发帖数量大,为统计研究提供了数量的保障;二是版主的自律性高,违反规定发帖的可能性小,因此被删除的概率小,统计的数据完整性高于普通用户;三是版主往往是本版的意见领袖,研究版主的特质,对于研究舆论传播中的意见领袖具有重要作用。   3 论坛版主发帖模式分析   首先通过利用上述的数学方法,采用Matlab 2015a编程,分析每名版主的基本特征,而后再探究版主的群体特征,并对版主群体进行分类研究。计算结果皆满足上述的假设检验。   3.1 论坛版主发帖个体行为实证分析   通过对92名版主的发帖时间间隔的累积分布进行拟合,发现个体行为均满足幂律分布。当x≥xmin时,在双对数坐标下α近似为一条直线。图1为天涯社区了望天涯版块的版主“枕着永远入眠”的发帖时间间隔累积分布。其他91名版主具有同样类似的图形。   由此推断版主论坛发帖的行为,符合幂律分布的特征,验证了Barabási推断,说明版主发帖的模式具有人类动力学的特性,即长时间的静默与短时间内的高频率爆发相结合的特征。   3.2 论坛版主发帖群体特征的实证分析   通过前面分析可知,论坛版主个体发帖的时间间隔,是由α、xmin决定的,采用蒙特卡洛法可对版主个体进行仿真。下面探讨版主群体的α、xmin、活跃度、阵发性的分布,为版主群体的仿真提供基础。   3.2.1 α的分布情况   通过计算,版主α指数介于1.5~2.75之间,这与Vázquez的预测不同。做直方图,发现数据版主群体α具有明显的右偏,不符合正态分布,通过极大似然拟合,发现α更符合Burr分布,如图2所示。   版主幂律指数在之间数量最多,并且向左右呈现

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档