- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于共词分析我国文献计量学探究主题分析
[摘要]
以CNKI数据库刊载的近十年(2000—2005年和 2006-11年)我国文献计量学研究论文为数据源进行共词分 析,利用Bicomb和SPSS软件,并借助聚类分析和因子分析, 研究高频词间的关系,探讨了国内近十年文献计量学的研究 主题:引文数量分析、引文网状或链状关系研究、科学知识 图谱与信息可视化及网络计量学。
[关键词]文献计量学;共词分析;聚类分析
[中图分类号1G250. 252 [文献标志码]A
[文章编号]1005-6041 (2012)05-0041-04
1前言
文献计量学是借助文献的各种特征数量,采用数学与统 计学方法来描述、评价和预测科学技术的现状与发展趋势的 图书情报学分支学科[1] o国外的文献计量学研究始于 1917年,至今经历了三个发展阶段[2-3] o我国的文献计量 学研究较国外要晚半个多世纪,发展历程分为三个阶段,即 起步阶段(1979—1982年)、发展初期阶段(1983—1987年) 和全面发展阶段(1988年至今)[4]。随着信息技术和网络的 发展,文献计量学的研究在内容和手段上也产生了新的发展 趋势,使文献计量学研究往更广、更深的方向发展。
本文试图通过对近十年国内文献计量学领域文献高频 关键词的共词分析,深入揭示其研究结构,进而探讨研究维 度、学科背景和理论基础,以期进一步把握近十年我国文献 计量学的研究现状、研究重点和发展趋势。
2数据处理
共词分析法是一种内容分析的方法,主要是通过对能够 表达某一学科领域研究主题或研究方向的专业术语共同出 现在一篇文献中的现象的分析,判断学科领域中主题间的关 系,从而展现该学科的研究内容与结构[5]。
作为共词分析的基本单元,本研究所利用的关键词样本 均来自于CNKI全文数据库,收集过程如下:以“文献计量 学”为关键词,通过关键词路径检索,选择模糊检索,分别设 定检索时间范围为2000—2005年和2006—2011年,检索截 止时间为2011年10月31日,共检索到2000—2005年1 434 篇文献,其中去掉190篇无关键词的文献,剩下1 244篇文献, 关键词共计1 448个;2006—2011年2 575篇文献,其中去掉 364篇无关键词的文献,剩下2 211篇文献,关键词共计2 838O
借助中国医科大学医学信息学系崔雷等人开发的书目 共现分析系统Bi comb,进行词频统计处理,2000—2005年和 2006—2011年分别选择出词频不小于10次和20次的关键词,
从而都确定了共有42个高频关键词作为共词分析的基础。
3共词分析
聚类分析就是对共词关系网络中的词与词之间的距离 进行数学运算分析,将距离较近的词聚集起来,形成一个个 相对独立的类团,使得类团内属性相似性最大,类团间相似 性最小[6] o本文首先用Bicomb软件分别提取2000—2005 年和2006—2011年两个时间段频次不小于10次和20次的 词篇矩阵,然后利用SPSS分别对两个时间段的词篇矩阵进行 系统聚类法分析,选择组间距离法和二值变量中的 “Ochiai”系数,采用样本聚类。词篇矩阵是指对关键字段 中出现一定频次的主题词等字段在每篇文献中的出现情况 进行搜索,最终生成词篇矩阵”,是关键词共词矩阵形成 的基础[7] o
根据两个时间段的因子分析碎石图,显示最佳的公共因 子个数区间为[6,8],本研究将聚类个数的范围值选定为6?8 个,结果如表1和表2所示。通过分析和对比,结合关键词的 属性,本研究认为2000—2005年和2006—2011年8个分类 最适合。
表1 2000—2005年各样品所属类别表
关键词8类
7类
6类
文献计量学111
引文分析222
统计分析331
核心期刊443
期刊111
文献计量222
引文331
载文分析222
论文331
学报331
分析331
网络计量学554
作者331
统计331
关键词
8类
7类
6类
科技期刊443
参考文献222
情报学111
文献665
作者分析222
网络信息计量学554
中国776
普赖斯指数
2
2
2
图书馆学
1
1
1
影响因子
4
4
3
科学计量学
5
5
4
载文
1
医学论文
1
1
1
科技论文
2
2
2
关键词
8类
7类
6类
期刊评价
4
4
3
评价
3
文献分析
7
7
6
半衰期
2
2
2
循证医学
1
1
1
信息计量学
5
5
4
期刊研究
2
2
2
SCI
4
3
发展趋势
1
1
1
载文量
您可能关注的文档
最近下载
- 咽喉用药市场白皮书.pdf VIP
- 临时用电施工方案.doc VIP
- 民族区域自治制度优秀教学课件.pptx VIP
- 人民大2024《人工智能与Python程序设计》课件(教材配套版)第10章-使用 Python 语言实现机器学习模型-回归分析.pdf VIP
- Lesson 3 at the seaside(课件)典范英语三年级上册.pptx VIP
- 人民大2024《人工智能与Python程序设计》课件(教材配套版)第9章-机器学习概述.pdf VIP
- 主体性概念的历史演变与理论探讨.docx VIP
- 普外科质量与安全管理小组活动记录.docx VIP
- 医院急性创伤患者救治流程.pdf VIP
- 讲义 16 分式讲 16 分式.doc VIP
文档评论(0)