- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于复杂网络的微博网络特征研究
贾悦婷 雷宏振
陕西师范大学国际商学院,陕西西安,710062
摘要:借鉴了复杂网络中体现网络结构特征的指标,比较了实验网络与WS网络、BA网络
的平均路径长度和聚类系数,验证了微博网络具有小世界和无标度特征。具体包括:通过微
博网络中的节点度数分析,发现绝大多数用户只有少量的关系人;通过对介数和接近数的分
析,验证了介数最大的节点并不意味着就是接近数最大的节点;通过与WS和BA网络进行对
比,发现实验网络具有较高的集聚系数和较短的平均最短路径;通过最小二乘法对度分布进
行拟合,发现关系网络度分布服从幂律分布;通过对度值和集聚系数的分析,发现度值高并
不意味着该点具有较高的集聚系数;通过对 “度-度”相关性的研究,发现实验网络具有度
异配性。
关键词:社会网络;小世界;无标度;微博
N94
合,可以用节点表示社会网络中的个体,用连接点和点的直线表示个体之间的关系,即使用
几何拓扑的方法去描述社会网络的结构。社会网络分析是数据挖掘的一个重要分支,它是一
种链接分析技术,通过研究社会网络,理解社会网络结构和行动者的行为过程。社会网络的
研究重点在于网络或联结关系的内容与结构,包括网络结构的连结、距离、密度及中心性,
以及关系网络所传递的资源特性等。
Web
2.0的社
社交平台越来越受到广大网民的喜爱。现在已经有以亿计的用户注册到基于Web
会网络中。Facebook是国外目前最大的基于Web2.0的社会网络,国内则以新浪微博发展
最为迅速。根据新浪微博官方调研显示,微博用户消费掉了全国54%的商品和服务,微博目
前每天能创造将近17亿元的消费空间3。基于Web2.0社交网络的研究包括两个主要方向。
一是从关系网络出发,研究信息在网络中的传播,属于社会网络研究。如建立社会网络的个
性化Web信息推荐模型,分析了网络中的用户偏好…;建立衡量企业微博营销效果和粉丝数
量的定量模型,以考察粉丝数量在企业微博短期营销过程中如何发挥影响作用拉1。二是通过
拓扑结构发现研究网络的复杂网络特征,属于复杂网络研究。如分析在线社会网络的拓扑性
质,解释在线社会网络中度异质性性产生的根源,指出在线的和现实的社会网络的形成具有
不同的底层机制口1;开发社会网络可视化平台,挖掘网站用户之间的关联关系,寻找用户之
间的最短路径,以及量化网络中团的耦合度等H1。
社会网络和复杂网络都源于图论,互联网上社交网络的普适性研究则应归于复杂网络范
畴临】。近年来,由于网络技术、计算机技术以及信息处理技术的迅速发展,研究人员获得了
许多大型实际网络的数据并对其进行了一系列统计分析。统计结果表明,绝大多数现实网络
都具有小世界现象、无标度行为等特性。复杂网络不是均质网络,而是异质的;复杂网络的
度分布不是服从Poisson分布,而是服从幂律分布哺’。目前,微博已经成为我国重要的在线
社交平台,触达了97%的主流社交媒体的使用者4。然而现有关于微博的研究大都基于营销
学和传播学视角,对微博的复杂网络拓扑研究尚未深入。本文基于现实微博关系数据,通过
分析小世界与无标度特征,研究在线社交网络的结构及信息传播机理。
3数据获取与处理
本文的实证数据来自于2012年12月1日采样的新浪微博。新浪微博是中国大陆是极具
影响力的微博,拥有超过3亿注册用户、超过30万认证用户。本次抽样采取“滚雪球”的
方法,即在IT领域随机挑选一个认证用户,观察其“关注”的对象,并在关注对象中挑选
加V认证的用户,从而得到第一组用户的信息;再对这一组用户中的每一位用户重复上述过
程,就可以得到下一组用户的信息。按照上述方法,可以得到共计由108位用户组成的用户
信息,这108位用户均集中在IT领域。
3数据来自2012年7月新浪公司、北京大学市场与媒介研究中心、第一象限公司共同发布的(2012年新
浪微博用户发展调杏报告》
4数据来自尼尔森在线研究于2012年发布的《中国社交媒体受访用户研究报告》
118
图1微博社区内交流网络的社群图
通过观察记录,将这108位用户之间“关注”与被“关注”的关系用一个108X108的
邻接矩阵来表示。由于“关注”
文档评论(0)