网络论坛虚拟社会的无尺度特性初探.pdfVIP

网络论坛虚拟社会的无尺度特性初探.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
究虚拟网络社会提供了定量依据。 2. 无尺度网络分析方法 2.1无尺度网络概念 许多自然状态下的网络(如万维网)表现出一种特别的属性,即,少数节点的连接数远高 于平均节点连接数,而且网络本身就是由这些具有众多连接的少数节点所支配的。包含这种 重要节点的网络被称为“无尺度网络”,而这些具有大量连接的节点被称为“集散节点”n¨。 分析无尺度网络最常用的模型为BA模型,其生成规则如下呻1:取初始m。个顶点任意 连接或完全连接,每一步在原网络G(t—1)的基础上加上一个新的顶点,同时加上从此顶点 出发的m(m≤mo)条边,形成新的网络G(t)。其中新加边的另一个端点按照正比于顶点度 厶 数的分布随机选取1-I(kf)=寻#_,重复以上新加点的过程足够多步,最后所形成的网络的 z—ikj 各顶点的度满足幂率分布p(k)~k~,如图1所示。 图l偏好依附模型生成网络韵度分布(m--m0=5,n=20000m2.97($86097) 2.2无尺度网络特性 首先,无尺度网络中节点的连接分布服从“幂次定律”,即任何节点与其他k个节点相 连接的概率,与1/I(成正比,且kn项中的n值,通常介于2~3之间。j 其次,无尺度网络属于高度非均一性网络,具有真实网络嚎撩常见的两个特性:增长和 偏好连接。即网络可以不断地扩张,且两个节点连接能力的差异可以随着网络的扩张而增大, 而最初连接较多的节点将形成更多连接,最终将会很有可能演变为集散节点。 第三,无尺度网络对意外故障具有极强的承受能力,但面对蓄意的网络攻击和破坏却可 能不堪一击。这是因为,无尺度网络中的节点除了集散节点外,大部分都是无效节点,如果 随机去除节点,那么所破坏的主要是这些不重要的节点,并不会防碍到整体网络;然而当面 对有预谋的攻击时,只需去除网络中有限的集散节点,整个网络就会被完全破坏。 上述性质对于研究属于无尺度网络的复杂网络具有重要理论价值。 网络论坛中的无尺度现象 1529 3.1真实网络论坛数据库 为了更好的分析网络虚拟社会,我们以网络论坛为研究对象对某真实网络论坛进行了数 据抓取,共获得约31 1天1,801,922条数据信息。其中首贴有830,990条,跟贴有970,932 条,月发贴量最小为2,062条,最大为12,065条,平均日发贴量为6,782条。每条信息都包 括:信息ID号,发贴时间,标题,正文字节数,作者,作者ID号,点击数,回帖数,父 贴ID号等内容。图2给出了整个数据库的日分布曲线,从中可以看出网络论坛的发贴量分 布具有一定的周期性。 图2数据库日分布曲线图 3.2作者发贴符合幂率分布 所采集数据库中,共有18,035个作者ID参与发帖,其对数统计图如图3所示,其中横 坐标为作者发贴量取对数,纵坐标为作者个数取对数。从图中可以看出发贴情况符合幂率分 布特性,幂次定律中kn项中的n=2.26.其中,单人最大发贴量为18,660篇,发贴量中约 10%网友的发贴量占全部发贴量的约85%,这表明绝大部分的贴予是由少数人发的,这一 点非常类似无尺度网络中的集散节点。 图3作者发贴情况统计 图4主贴点击数统计 3.3点击数符合幂率特性 同样主贴点击数也符合幂率分布特性,如图4所示,其中横坐标为主贴点击数取对数, 纵坐标为主贴个数取对数。计算可得n=2.81。最大一篇主帖的点击数为237,516次,点击数 篇,占总发贴量的73.29%;点击数在1,000次以上的贴子共有1,164篇,占总发贴量的 1530 0.0646%。相比于所有主贴的点击数,只有少数贴子的点击数非常高,而且在互联网中这些 贴子常被其他网友反复转载,如果将这种情况也考虑进去,11值则会更高。 同样,对于贴子的回复数,也具有与点击数相类似的分析结果,这里不雨赘述。 3.4网络虚拟社会的无尺度网络构建 以作者ID为:宵点,以作者之间的回复关系为边,可以构建网络虚拟社会关系的拓扑图。 该图可分为两种形式: (1)有向图,以跟贴的发贴者ID为起始节点,以该跟贴的父贴作者ID为指向节点,构 造有向线段所组成的网络图; (2)无

文档评论(0)

hnlhfdc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档