知识组织视角下关键词网络中小世界现象.docVIP

知识组织视角下关键词网络中小世界现象.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识组织视角下关键词网络中小世界现象

知识组织视角下关键词网络中小世界现象   摘 要:文章基于Scopus中2008年的11144个关键词构成的网络,结合复杂网络的相应知识,基于小世界网络的平均度和聚集系数这两个特征,通过统计和计算,揭示出关键词网络呈现出小世界的效应。基于由关键词构建的网络,文章初步探讨了通过关键词网络的中介度来确定学科知识点的方法,并与基于词频确定知识点的方法进行了简单的对比。   关键词:关键词网络 小世界现象 聚集系数 中介度   中图分类号: TP391.3;G254.29 文献标识码: A 文章编号: 1003-6938(2013)06-0019-04   1 引言   所谓知识组织,是指对事物的本质及事物间的关系进行揭示的有序结构,即知识的序化[1],本文针对学术论文的关键词进行用复杂网络的方法进行相应知识组织的分析和探究。从具体分析看,作为由词汇组成部分的学术论文的关键词在一定数量的基础上,呈现出了网络的特征,根据关键词网络的特征,结合复杂网络的相关知识,发现该网络具有小世界的特性。   复杂网络的诸多研究起源于Erd?s and Rényi(1960)构建的随机图理论[2],Gure(1990)在此基础上提出了著名的六度分隔理论[3]。通过类比小世界现象,具有较高聚集性质和较小连通距离的网络被称为小世界网络(Watts and Strogatz)[4]。Newman and Watts (1999)提出了真实空间的重整化群转换模型,并论证了转换被精确限定在大系统规模中[5]。平均最短路径和聚集系数可以用来验证一个网络是否具备小世界性质(Dorogovtsev and Mendes 2002; Albert and Barabasi 2002; Strogatz 2001; Jeong et al. 2000; Schnettler 2009)[6-10]。很多学科都对小世界现象有所研究,比如生物技术、基因工程、软件工程和语言学等[11-15]。在信息计量学中,Hung and Wang ( 2010)基于RFID专利数据验证了专利引用网络中的小世界现象[16]。Amancio et al. (2012)发现将论文以文本形式构建为复杂网络时,引文列表中并不包含与原论文相似的文献[17]。   2 关键词网络的定义   根据关键词构成中的词汇分布情况以及关键词的共现,关键词之间存在一定的连通性,一定规模的关键词会构成一个有效的网络,形成关键词网络。根据上述的描述,本文对图情领域的关键词???行了网络的构建。由于整个网络规模太大,难以全部展示,图1给出了以关键词“Citation Analysis”为核心的,最短连通路径小于等于2的关键词网络。   所有的图情领域的关键词直接从SCOPUS数据库中根据“ASJC-CODE”字段提取,该字段表示学科分类号。所选取的规模为Scopus中2008年中共11144个关键词。为了更好地计算、分析和观察关键词所形成的网络,本文对从Scopus中提取的关键词数据,进行了一定的数据清洗操作,例如去除关键词中的括号、逗号和其他符号,转换数字,词形还原等(数据清洗规则见表1)。   3 关键词网络的小世界效应   随机网络模型(stochastic network model)的经典模型是Erd?s和Rényi提出的ER随机网络模型。真实的关键词网络模型并不是ER模型,但在关键词网络研究中,为了界定关键词网络的特性,突出关键词网络的特征,在关键词网络整体特征统计分析时,往往与ER随机网络进行比较。小世界现象是真实网络的一个重要特征,判断真实网络与ER随机网络的一个重要指标是聚集系数。该参数是往往用来判断一个网络是否是小世界网络的关键特征。在复杂网络中,节点i与j的距离就是连接节点i和节点j所需的最短路径长度。相比随机网络,关键词网络中的相对较小。在关键词网络中,表示从一个关键词节点到另一个关键词节点所需要的平均最短路径长度,该参数是判断小世界网络的重要参数之一(关键词的随机网络模型和真实关键词网络的相关指标值见表2和表3,其中,表2是数据清洗后的计算值,共包含关键词91225个,表3是数据清洗前的计算值,共包含关键词111444个)。   3.1 关键词网络的平均最短路径   在复杂网络中,节点(node)i与j的距离d(i,j)是连接节点i和节点j所需的最短路径长度,整个网络的平均路径长度可以用公式(1)计算:   在公式(1)中,N是网络中节点的数量,i和j分别为网络中的节点,表示整个网络的平均路径长度。大部分真实网络都具有较小的,在关键词网络中,表示从一个关键词节点到另一个关键词节点所需要的平均路径长度。表2显示,真实关键词网络的平均最短路径为4.9,而随机关键词网络的

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档