基于引文耦合数字图书馆研究结构可视化分析.docVIP

基于引文耦合数字图书馆研究结构可视化分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于引文耦合数字图书馆研究结构可视化分析

基于引文耦合数字图书馆研究结构可视化分析   [摘要]从CSSCI数据库中下载1998-2007年关于数字图书馆领域期刊文献的题录和引文数据,利用自编的JA―VA程序进行处理,计算了956篇文献间的引文耦合数量,确定了数字图书馆的研究结构和基础文献,并在此基础上利用开源可视化工具对研究结构进行了可视化,直观显示具有相同主题的文献之间的关系。   [关键词]引文耦合分析 数字图书馆 可视化 研究结构   [分类号]G350      1 引 言      2009年6月,由美国计算机学会(Association forComputing Machinery,ACM)、电气和电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)资助的数字图书馆联合大会(Joint Conference on Digit―al Libraries,JCDL)召开第九次会议,讨论了数字图书馆的现状及未来发展。国内同样非常关注数字图书馆研究,在一次国内专家调查中,数字图书馆被认定为情报学前沿研究领域,并且其领域的立项数量多年一直处于首位。      2 引文耦合分析概述      引文耦合分析(bibliographic coupling)是文献计量学的重要方法之一,也是构建某个研究领域的研究结构(即研究子领域,有时也称为研究前沿或者研究热点)中常用方法。如果两篇文献的参考文献中相同的引文数越多或者它们被一起引用的次数越多,则它们的相似性就越高。因此,根据这种相似性对文献进行聚类,在某种程度上可以揭示出某一研究领域的研究结构。由此,产生了两种基于引文的分析技术,即引文耦合分析和同被引分析。引文耦合分析的基本观点是通过文献之间的相同引文数来对文献进行聚类;同被引分析的基本思想是根据文献共同被引用的次数来对文献进行聚类。   利用引文耦合方法对数字图书馆方面的文献进行聚类,期望能够从中发现数字图书馆的研究结构和基础文献。      3 引文耦合分析基本程序      采用引文耦合分析方法分析数字图书馆的研究结构和基础文献。基本程序如图1所示:      文章的分析对象是期刊文献,因为期刊文献是学科研究结果的主要载体,能够反映学科的发展状况。Ziman认为期刊文献在科学知识的传播、交流、保存过程中有着独特作用???他还列举了期刊文献所具有的一系列特征:正式的、永久可以访问、公开性、不可更改性、可追溯性、可引用性、经过审查、经过索引、在范围上和长度上有限制以及内容的创新性等。      3.1 数据源选择   国外引文分析的常用数据库是ISI’s Web 0f Sei-enee,国内的中文社会科学引文索引(CSSCI)是社会科学权威的引文数据库。本文以CSSCI数据库为数据源,选择1998-2007年的来源文献数据库,在关键词字段中以精确方式检索“数字图书馆”,文献类别选择“论文”,共计检索出956篇文献,然后分别下载这些文献的完整题录信息(包括文献的标题、关键词、作者、单位、参考文献等)。      3.2 把原始文献数据存入数据库   利用JAVA语言编程将原始文献数据存入到数据库中。一篇完整的文献题录信息主要包括基本题录信息和参考文献信息。为了提高匹配效率我们将引文分成两种类型,即期刊文献类引文和非期刊文献类引文,并为这两种引文类型分别建表。文献基本题录信息表包括文献ID、文章标题、作者、作者单位、文献类型、发表期刊、发表时间、关键词、被引频次等字段。期刊文献类引文信息表包括ID、被引文献ID、被引文献标题、被引文献作者、被引文献发表期刊、被引文献发表年份、被引文献类型等字段。非期刊类引文的表结构和期刊类引文的表结构相类似。需要特别说明的是,下一步计算文献对的引文耦合数时仅考虑期刊文献类引文,并没有考虑其他类型(如书籍、研究报告、网页等)的引文。      3.3 计算文献对之间的引文耦合数   计算文献对之间的引文耦合数量是引文耦合分析的关键步骤,其基本思路可以概述为:①从数据库中选取所有文献的ID,然后把文献ID两两进行组合;②从期刊文献型引文表中分别抽取出这两篇文献的引文进行比较;③将文献对之间的引文耦合数存入数据库。本文总共有956篇文献,这些文献共有456 490对组合。其中,1166个文献对的引文耦合数大于或等于1,102个文献对的引文耦合数大于或等于2。在考虑文献之间的相似性程度和文献数量的基础上,我们仅分析引文耦合数量大于或等于2的文献对情况。      3.4 引文耦合可视化   利用开源可视化工具将符合要求的文献对用图形表示出来,一个顶点表示1篇文献,一条边表示2篇文献之间存在的引文耦合关系,边的权表示

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档