基于共词分析我国文献计量学研究主题分析.docVIP

基于共词分析我国文献计量学研究主题分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于共词分析我国文献计量学研究主题分析

基于共词分析我国文献计量学研究主题分析   [摘 要]   以CNKI数据库刊载的近十年(2000—2005年和2006—11年)我国文献计量学研究论文为数据源进行共词分析,利用Bicomb和SPSS软件,并借助聚类分析和因子分析,研究高频词间的关系,探讨了国内近十年文献计量学的研究主题:引文数量分析、引文网状或链状关系研究、科学知识图谱与信息可视化及网络计量学。   [关键词]文献计量学;共词分析;聚类分析   [中图分类号]G250.252[文献标志码]A   [文章编号]1005-6041(2012)05-0041-04   1 前 言   文献计量学是借助文献的各种特征数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分支学科 [1] 。国外的文献计量学研究始于1917年,至今经历了三个发展阶段[2—3]。我国的文献计量学研究较国外要晚半个多世纪,发展历程分为三个阶段,即起步阶段(1979—1982年)、发展初期阶段(1983—1987年)和全面发展阶段(1988年至今)[4] 。随着信息技术和网络的发展,文献计量学的研究在内容和手段上也产生了新的发展趋势,使文献计量学研究往更广、更深的方向发展。   本文试图通过对近十年国内文献计量学领域文献高频关键词的共词分析,深入揭示其研究结构,进而探讨研究维度、学科背景和理论基础,以期进一步把握近十年我国文献计量学的研究现状、研究重点和发展趋势。   2 数据处理   共词分析法是一种内容分析的方法,主要是通过对能够表达某一学科领域研究主题或研究方向的专业术语共同出现在一篇文献中的现象的分析,判断学科领域中主题间的关系,从而展现该学科的研究内容与结构[5]。   作为共词分析的基本单元,本研究所利用的关键词样本均来自于CNKI全文数据库,收集过程如下:以“文献计量学”为关键词,通过关键词路径检索,选择模糊检索,分别设定检索时间范围为2000—2005年和2006—2011年,检索截止时间为2011年10月31日,共检索到2000—2005年1 434篇文献,其中去掉190篇无关键词的文献,剩下1 244篇文献,关键词共计1 448个;2006—2011年2 575篇文献,其中去掉364篇无关键词的文献,剩下2 211篇文献,关键词共计2 838。   借助中国医科大学医学信息学系崔雷等人开发的书目共现分析系统Bicomb,进行词频统计处理,2000—2005年和2006—2011年分别选择出词频不小于10次和20次的关键词,从而都确定了共有42个高频关键词作为共词分析的基础。   3 共词分析   聚类分析就是对共词关系网络中的词与词之间的距离进行数学运算分析,将距离较近的词聚集起来,形成一个个相对独立的类团,使得类团内属性相似性最大,类团间相似性最小[6] 。本文首先用Bicomb软件分别提取2000—2005年和2006—2011年两个时间段频次不小于10次和20次的词篇矩阵,然后利用SPSS分别对两个时间段的词篇矩阵进行系统聚类法分析,选择组间距离法和二值变量中的“Ochiai”系数,采用样本聚类。词篇矩阵是指对关键字段中出现一定频次的主题词等字段在每篇文献中的出现情况进行搜索,最终生成“词篇矩阵”,是关键词共词矩阵形成的基础[7] 。    根据两个时间段的因子分析碎石图,显示最佳的公共因子个数区间为[6,8],本研究将聚类个数的范围值选定为6~8个,结果如表1和表2所示。通过分析和对比,结合关键词的属性,本研究认为2000—2005年和2006—2011年8个分类最适合。   表1 2000—2005年各样品所属类别表   关键词8 类   7 类   6 类   文献计量学111   引文分析222   统计分析331   核心期刊443   期刊111   文献计量222   引文331   载文分析222   论文331   学报331   分析331   网络计量学554   作者331   统计331   关键词   8 类   7 类   6类   科技期刊443   参考文献 222   情报学111   文献665   作者分析222   网络信息计量学554   中国776   普赖斯指数   2   2   2   图书馆学   1   1   1   影响因子   4   4   3   科学计量学   5   5   4   载文   3   3   1   医学论文   1   1   1   科技论文   2   2   2   关键词   8 类   7 类   6类   期刊评价   4   4   3   评价   3   3   1   文献分析   7   7   6  

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档