- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章
中心性、权力与瓶颈
在前一章,我们花了不少时间讨论图论的抽象概念。在这一章,我们将讨论如何进行真
实的社会网络分析。我们将以社交媒体博客站点LiveJ 的数据集为例,特别是
针对其中一群发言活跃的俄罗斯移民,尝试通过社会网络分析技术了解他们的团体状
况。
我们即将介绍的第一种社会网络分析指标称为“中心性”(centrality )。初学者往往了
解到的是“程度中心性”(degree centrality ),而没有意识到它仅是“中心性”指标中
的一项,这些指标既可合并使用也可单独使用。本章将介绍“中心性”最为常用的四种
指标,但首先让我们看看如何获取数据。
样本数据
LiveJournal是一家在俄罗斯和东欧地区非常受欢迎的博客网站。截至目前,它已提供约
3800万篇博客,其中大多数使用英文之外的其他语言。它的底层服务器端软件使用开源
语言开发,提供简单的 接口和大量可用于数据挖掘和数据机器人的接口(http://www.
API
/bots/ )。
我们将呈现一组通过“滚雪球抽样法”(可参考附录 )采集到的数据并由此获得适合
A
进一步分析的数据集。
使用Python与NetworkX获取数据
如果你还没有安装 与 环境,请参考附录 。
Python NetworkX B
42
现在让我们首先开始使用 与 。启动 ,然后导入 库与
Python NetworkX Python NetworkX
UrlLib库(不久后需要用到它)。
% python
import networkx as net
import urllib
NetworkX以图(graph )为基本数据结构。图既可以由程序生成,也可以来自在线数据
源,还可以从文件与数据库中读取。现在,让我们手动创建一个简单的图(见图 ):
3-1
g=net.Graph() #创建空图
插入一条连接 的边到图中,节点将自动插入
g.add_edge(a,b) # a,b
再插入一条连接 , 的边
g.add_edge(b,c) # b c
再插入一条连接 的边
g.add_edge(c,a) # c,a
输出一个三角形的图,如图 所示
net.draw(g) # 3-1
图3-1 :简易图示例
你也可以将图的节点与边作为Python列表输出:
输出图 的节点值
g.nodes() # g
[a,b,c]
输出图 的边值
g.edges() # g
[(a, c), (a, b), (c, b)]
中心性 权力与瓶颈
、 |43
中的图数据结构就像 的 字典( )一样——一切都能循环,并根据键
NetworkX Python dict
值读取。
g.node[a]
{}
g.node[a][size]=1
g.node[a]
{size :
文档评论(0)