- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人人网交流模式社交网络研究和可视化实现
人人网交流模式社交网络研究和可视化实现
摘 要 本次研究中选定人人网为研究对象,使用社会网络分析的方式探索社交世界的交流模式。社会网络分析在我国是一门刚刚引入的新鲜学科,本文采用这一先进技术,用社会网络分析法和统计学方法对社交网络进行科学描述,主要探究人人网内部连接情况、找到位于社群中心位置的用户、并分析用户的中心位置与活跃度是否存在内在关系,最后使用可视化技术将研究结果呈现。
关键词 人人网;社会网络分析法;统计学方法;可视化技术
中图分类号:TP392 文献标识码:A 文章编号:1671-7597(2014)04-0035-02
1 人人网数据的采集及处理
采用滚雪球抽样的方法抽取样本,选定初始的三个人人网用户,使用火车头数据采集器采集对应的好友网址,采集结果直接保存在本地数据库中。编写C语言程序在三个起始用户的人人好友中随机抽取12个二级用户,继续采集12个人人用户的好友,最后获取了2059个样本数据。利用createpajek软件将样本数据文件转化为.net的格式,方便后续分析软件的使用。处理结果使每个用户对应不同的编号,并用对应关系表示好友关系的存在。
2 社会网络分析
利用社会网络分析法的四项指标对采集的人人网数据进行分析,分别是网络密度、可达性、点度中心度和图的点度中心势指数。将采集数据导入pajek软件中,进行分析。
2.1 网络密度分析
抽象地说,一个图的密度就是对这个图的完备性的一种测度。网络密度在一定程度上象征着这个网络中关系的数量与复杂程度。密度为1,则每个个体都与其他所有个体产生关系。
利用pajek软件实现对人人网网络密度的测量,具体的步骤是在PAJEK中选“Info-Network-General”项目。结果显示,在所有2059个样本组成的网络中,该网络的平均网络密度仅为0.03,考虑到可能是图的规模使得结果偏小,为了使结果更加准确我们采用样本密度估计总体密度的办法,随机抽取3个30人的样本,结果分别为0.08,0.10,0.11,取平均值0.097,有研究指出在实际网络中能够发现的最大密度是0.5,可见人人网的网络密度值偏小。
2.2 可达性分析
可达性考察一个网络的连通性(connectivity),它的意义是:图中所有个体在多大程度上通过有限个步骤相互联络在一起。测量可达性的指标是直径(diameter)。直径表示图中任意可连通的两点之间的最大距离。直径短,表示可以通过很少的步骤访问完整个网络/最大关联图。
利用pajek软件实现对采集数据的diameter测量,具体的步骤是“Net—Paths between 2 vertices—Diameter”。软件处理的结果表明,直径为5,根据“六度分隔”理论的内容,在现实社会中表明人人网用户之间的可达性较强。最大关联图规模较强,基本实现了互联。
2.3 点度中心度分析
形象地说,度数就是某个点引出来的线的条数。反映在数据上,某个个体的度数就是邻接阵中这个个体所对应的行的行和或者列的列和(考虑到对称性)。点度中心度(point centrality)是社会网络分析的重点之一。如果一个点与其他许多点直接相连,就说该点具有较高的点度中心度。该点所对应的行动者也是中心人物,拥有最大权力。这里的权力是指网络中行动者之间存在的一种互动模式。
在进行点度中心度和图的点度中心势指数分析时,根据统计学分析中参数估计的原理,随机抽取样本总体中20个人人用户,并查找他们之间的好友关系。将用户之间的好友关系用一个邻接矩阵的形式表达出来,矩阵中“1”表示好友关系存在,“0”表示不存在。
通过UCINET软件进行点度中心度的测量结果和点度中心势的测量结果分别如图1、图2所示。
图1 点度中心度的测量结果
图2 点度中心势的测量结果
从图1来看,不同的用户表现出不同的中心度,中心度最高的用户,即他的好友数量最多,如20号用户中心度为9,1号和2号用户中心度为8,说明他们在人人网信息传播中拥有较大的权利,他们发布的消息为更多人所注意。但是其内中心度最大值为9,平均值仅为3.1,可见,是过大的外中心度干扰了中心度的测量,造成了它们“位于网络中心”的表象。
2.4 图的点度中心势指数分析
点度中心势指数(centralization of a graph),指的就是网络中点的集中趋势,不同结构的图中心趋势存在很大差异,从另一个角度来说,如果一个网络中“点的点度中心度差异很大”,则该网络的向心趋势就较为明显,反之,则中心势较小。
图2中结果样本的整个网络标准化中心势为4.05%。中心势越接近1,说明网络越具有集中趋势(centralizat
文档评论(0)