基于共词分析国内高校数字图书馆研究主题分析.docVIP

基于共词分析国内高校数字图书馆研究主题分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于共词分析国内高校数字图书馆研究主题分析

基于共词分析国内高校数字图书馆研究主题分析   关键词:高校数字图书馆;共词分析;主题分析   摘要:文章从共词分析的角度分析我国高校数字图书馆的研究现状,以CNKI为数据源,选取2000―2015年发表的数字图书馆领域的期刊论文和学位论文为样本数据,借助BICOMB2书目共现分析系统以及SPSS21.0统计分析软件等工具,利用共词分析、因子分析、聚类分析等方法,得出目前高校数字图书馆领域存在的7个研究主题。   中图分类号:G251.5文献标识码:A文章编号:1003-1588(2016)04-0034-03   1文献来源和方法研究   文章从CNKI选取中国学术期刊网络出版总库、中国博士论文全文数据库和中国优秀硕士学位论文全文数据库作为数据统计来源,利用高级检索功能,设定检索条件“‘篇名=数字图书馆’并含‘高校’”并选择“精确匹配”,将检索时间限定为“2000年1月1日”到“2015年5月31日”,共检索到1,049篇文献。笔者借助BICOMB2、EXCEL、SPSS等软件进行数据处理。   2数据统计与分析   2.1文献增长规律研究   笔者统计了2000年到2015年5月31日各年份的发文总量和累计发文量,如图1所示,以2011年为分界点,2011年之前的各年份发文量呈上升趋势,2011年之后各年份的发文量呈逐年下降的趋势(2015年是部分调查)。该领域的研究文献累积量呈逐年递增的态势,并逐步趋于平缓。经过多年的研究,数字图书馆研究渐渐进入平稳期,已经积累了相当数量的研究成果,在此基础上增速会减慢。   根据普赖斯对科技文献增长阶段的划分,国内高校数字图书馆领域的研究已跨越起步阶段和大发展阶段,趋向于学科成熟阶段。   2.2期刊来源统计   2000―2015年5月31日发表的有关高校数字图书馆领域的1,049篇文献共分布在415种期刊上。其中,《科技情报开发与经济》和《现代情报》的刊载论文数量最多,仅此两种期刊即刊载了近11%的论文,足见它们对高校数字图书馆的关注度较高。前36种期刊的累计发文量超过总数的50%。S.C.布拉德福在《文献工作》中写道:“如果将科学期刊按其登载某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成1:a:a2……的关系。”[2]将415种期刊按其累计发文量降序排列,按照核心区、相关区和外围区的载文总量n1:n2:n3=1:a:a2的比值关系,经测算a=4.5,据此确定累积发文量占总论文数34.6%的前16种期刊(见表1)为该领域的核心区文献来源。其中,《图书情报工作》《图书馆学研究》《图书馆论坛》《大学图书馆学报》等属于北大期刊目录cssci(2014―2015)来源期刊,其累积载文量占整个核心区期刊载文量20.9%,符合二八定律,这20%左右的高质量期刊可以弥补该领域文献质量整体不高的不足。为检验期刊分区的准确性,绘制布拉德福分散曲线,如图2所示,核心区分界点C的坐标为(1.2363),曲线AC拟合指数增长的拟合优度达0.971,CB拟合直线的拟合优度达0.9827,因此,可判定高校数字图书馆领域的期刊分布符合布拉德福定律。   3基于共词分析的高校数字图书馆主题内容分析   3.1高频词的选定   主题词频分析直接从知识的产生、发展上正面剖析科学文献的动态规律,是研究知识运动轨迹的最有效的方法。关键词作为主题词的一种,既可以揭示论文的精髓,又可以通过其词频的高低揭示某一领域的学科发展热点。笔者利用BICOMB2.0从1,049篇论文中共提取关键词3,177个,对关键词进行筛选后,共得到有效关键词2,816个。在高频关键词的选定问题上,笔者借鉴杨爱青等经过实证分析提出的词频g指数,以此确定高频关键词的阈值。根据词频g指数的定义,某一个研究主题关键词的数量分值为g,当且仅当此研究主题的关键词总量N中,有g个关键词其累计出现频次不少于g2次,而g+1个关键词其累计出现频次小于(g+1)[3],计算出g=40,确定该领域的前40个关键词作为高频关键词,如表2所示。   3.2因子分析   为了解决聚类分析时聚类个数难以确定的问题,借鉴相关学者的研究经验,参考因子分析所确定的因子个数寻找聚类分析的分类点来解决这个问题。[4]为了降低主题关键词对聚类效果的影响,笔者剔除了“数字图书馆”“高校数字图书馆”“高校图书馆”和“高校”等四个关键词,构建36×36的矩阵。对新构建的矩阵进行正态分布检验,发现其Lilliefors显著性水平小于0.05,拒绝正态分布假设,且通过判断变量的峰度系数和偏度系数并结合观察变量的Q-Q概率图,也发现其不符合正态分布规律。鉴于矩

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档