- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学知识网络自相似性的实证研究
科学知识网络自相似性的实证研究
摘要:科学计量学的研究都是以科学知识的自相似性作为理论假设的,尤其是科学知识图谱更是以科学文献等在空间上的自相似性为前提,因此对科学知识网络自相似性的检验与证明是必不可少的。应用科学计量学与复杂网络分析的方法,选取网络的平均聚类系数、平均最短路径和平均度三个特征指标,建立科学知识网络的自相似模型,并对合作网络、共词网络与共被引网络的自相似性进行定性与定量的分析,从而验证了科学文献的网络拓扑结构的局部与整体具有自相似。
中国论文网 /4/view-7057822.htm
关键词:科学文献;科学知识网络;自相似性;科学计量学;知识图谱
中图文献号:G302;F224 文献编码:A DOI:10.3969/j.issn1003-8256.2015.01.006
1 引言
科学计量学是应用数理统计和计算机技术等方法对科学技术本身进行定量分析的一门交叉学科,其定量分析的对象为科学知识,文献等是科学知识的重要载体。但是在实际研究过程中获取所有知识总体是不现实的,因此利用选取期刊或是关键词检索获得数据样本,成为科学计量学研究的最主要途径 。这种途径是建立在科学知识具备自相似性的假设前提下的,即样本和总体的相似。
伴随着科学技术的迅猛发展,科学知识也在大规模地扩张,例如每年SCI数据库的文献增长量就达到100多万篇,巨大而复杂的科学知识数据,为科学计量学提出了极大的挑战。然而,复杂网络分析、计算机技术、信息可视化等相关技术和方法的发展为科学计量学注入了新鲜的血液[1][2],使得科学知识图谱[3][4]与知识可视化技术[5]成为了科学计量学的新航向,并在反恐主义研究领域分析[6]、科技期刊引文环境[7]等诸多领域得到广泛应用。然而,对于某一学科领域来说数据量过于庞大,展现所有数据的知识图谱是现有技术无法实现的,所以知识图谱的绘制只能选择一部分高被引或其他告知标志的文献,正是由于自相似性假设的存在,使得高被引文献的知识图谱也能反映总体的一部分特征。
因此,无论是科学计量学还是科学知识图谱的研究都以科学知识自相似性的存在作为理论前提的。1990年Van Raan意识到科学知识的相似性,率先验证了科学知识的分形结构,并证明了随着共被引文献规模的增加,其分数维数呈指数分布形式增加[8][9][10]。随后Brunk GG[11]、Bailon-Moreno R[12]等在此基础上,对科学知识系统的分形结构进行了探讨。以上研究都局限于分形结构的研究,关注科学论文在时间上的扩散与增长,对于其它自相似结构尤其是共被引网络等空间结构的自相似并没有涉及,并且缺乏对自相似性的检验与证明。除此之外,通过文献的大量检索鲜见科学知识自相似性的研究,在国内的文献中并没有检索到相关研究。
同时,自相似性在数据通信[13]、人类生物网络[14]以及复杂网络等诸多领域被研究,C.M.Song与S.Havlin[15] 等人利用重构化理论来揭示复杂网络的自相似分形特征;R.Guimera 与L.Danon[16]在研究中利用邮件系统来揭示社区结构的自相似分形特征;陶少华[17][18]等分别研究了基于信息维数与容量维数的复杂网络的自相似性,建立了基于自相似分型特征的网络演化模型,并且说明动态增长的复杂网络的确是自相似的,这些研究为本项目提供了启示与参考。
本文主要研究科学文献在空间上的自相似性,选取科学文献所组成的知识网络中平均聚类系数、平均最短路径、平均度三个基本指标,随着网络规模的变化情况,建立模型验证科学文献在网络拓扑空间中的自相似性,从而为解释科学规律,明确科学计量学中的数据选择尺度提供参考。
2 科学知识网络的自相似模型
2.1 指标选取
自相似性是指某一物体的局部可能在一定条件下或过程中,在某一方面例如状态、结构、信息、功能、时间、能量等都表现出与整体的相似性,即具有尺度不变性。空间自相似性是一种非常普遍的现象,通常被理解为系统的部分和整体在空间形态和结构上存在某种相似性。而科学文献空间的自相似性是指由科学文献的作者、关键词或者参考文献等所组成的空间结构的局部与整体具有某种相同的性质。目前,在科学文献的计量分析中,科学知识网络,包括合作网络、共词网络、共被引网络等是科学文献空间上拓扑结构最好的表现形式。
随着对复杂网络研究的深入,研究者提出了许多特征指标,来描述各种不同类型的复杂网络的共同特征,同时也用来衡量各种复杂网络演化模型的准确性和有效性。目前,研究比较充分的统计特性有平均聚类系数、平均最短路径、平均度等[19]。
(1)平均聚类系数:假设网络中的一个节点i有ki条边将它与其它节点相连,这ki个节点称为节点i的邻居节点,在这ki个邻居节点之间最多可
您可能关注的文档
最近下载
- 外教社新世纪英专本科生系列(修订版):英语阅读 第1册 PPT课件Unit 3.pptx VIP
- 毕业论文的选题及开题报告的撰写.pptx VIP
- 初中语文2025届中考常考易错字词汇总(多音字+形声字+易错字形+易错成语).pdf VIP
- 4清洁生产的实施途径.pptx VIP
- 中视科华有限公司北京技术服务分公司招聘笔试题库2025.pdf
- JJG 1201-2024 数字式轮胎压力表.pdf
- 高标准农田建设项目监理实施细则.docx
- 四川省成都市2022-2023学年八年级下册期末物理试卷3(含答案).pdf VIP
- 钩端螺旋体病疫情应急处置技术方案.doc VIP
- GB 24430.1-2009 家用双层床安全第1部分:要求.docx VIP
文档评论(0)