图书情报学知识图谱构建与解读.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图书情报学知识图谱构建与解读

图书情报学知识图谱构建与解读   摘要:当今社会信息技术发展日新月异,互联网技术、数据库技术、人工智能技术等在各个领域的应用日臻成熟;信息化数字化时代的到来,信息的获取和利用日益方便和快捷,为科学研究提供了不可或缺的分析基础,这些都为科学计量学的研究奠定了发展基础。   关键词:图书情报学知识图谱聚类分析   1. 绪论   知识图谱(Mapping Knowledge Domains)是显示科学知识的发展进程与结构关系的一种图形,它以科学知识为计量研究对象,属于科学计量学范畴[1]。它是基于内容分析、引文网络分析和信息可视化的一种可视化显示知识以及相互关系的一种图形,已经成为当前科学计量学中比较热门的研究方法。知识图谱在图书情报学领域也称为知识域可视化或知识领域映射地图,是现实知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系[2]。   2. 图书情报学知识图谱的构建   2.1 数据获取和处理   对于高频主题词的提取,目前国内外还未形成统一权威的标准。大多数学者在选择小样本主题词时都是按照词频大于某个特定值的方法,认为大于这个特定值即可认定该主题词是高频主题词。此外还需要考虑提取的高频主题词占所有主题词词频的比重,根据主题词累积词频的变化截取高频主题词。   2.2 共词分析   共词分析是一种内容分析技术,它通过分析在同一个文本主题中的款目对共同出现的形式,确认文本所代表的学科领域中相关主题的关系,进而探索学科的发展。共词分析的主要作用是通过对高频主题词的聚类,发现研究对象的分析热点和主要内容,深入揭示相对应的研究结构,进而系统探讨其研究维度、学科背景和理论基础,以期进一步把握其研究现状、学术热点及发展趋势。   2.3 相关分析   相关分析是研究现象之间是否存在某种依存关系,是以分析变量间的线性关系为主,是研究它们之间线性相关密切程度的一种统计分析方法[3]。通过相关分析,界定任意两个主题词之间的距离,以及这种距离所代表的关系,从而进一步确定主题与主???直接或正或负的联系。   相关分析是整个数据处理过程中比较简单的一步,却至关重要。SPSS的统计分析是建立在相关系数的基础上,需要基于相关矩阵表进行。因此,须将以上共词矩阵经过特定的相关性转化为相关矩阵,以便SPSS统计分析。共词矩阵转化为相关矩阵通过Excel来完成,具体步骤是:在Excel中加载宏,导入分析工具库-VBA函数,使用Excel中自带的数据分析模块进行相关系数的计算,通过“工具”-“数据分析”-“相关系数”,对共词表中的每一列进行相关系数的运算,由此可以得到完整的100*100的相关矩阵表。得到100*100主题词相关矩阵后,就可以通过SPSS统计分析工具进行因子分析,聚类分析以及多维尺度分析,并构建图书情报学知识图谱。然后通过SPSS对主题词进行了一系列的因子分析、聚类分析和多维尺度分析,在此基础上得到图书情报学研究的各个大类,   3. 图书情报学知识图谱的解读   3.1 基于主题词的总体分析   对主题词的总体分析主要是对研究范围内选取的样本进行SPSS分析后获取的前100位的主题词上,在图谱构建中主题词对应的百分比就表示在这一年该主题词出现的次数占该年所有提取的主题词总词频数的比重。“平均比重”则表示该主题词在研究年限范围内的平均值;“变化状态”表示研究年限范围内的变化情况,会有“持续上升”和“持续下降”两种情况;“无显著规律”则表示该主题词在研究年限内变化比较反复;研究年限中的“末年比初年增长幅度”表示末年比初年的增长比例,用以衡量该主题词在末年的关注度和热度相较初年的情况,比例越高,增速越大,发展越快。   3.2 学科发展的现状与热点   通过前文的统计分析和当前科学研究趋势可以将图书情报学研究的结果进行具体分类,当前对于图书情报学研究的文献显示,通过对2005-2011年的主要样本进行分析后能够将图书情报学图谱分为11个大类,从而得出当前图书情报学的科学发展现状与热点分别是:医学信息学、信息计量学与出版、图书馆系统、计算机技术与管理、网络信息资源、信息管理与信息系统理论、电子资源、网络资源与医学图书馆、数字图书馆、教育与信息素养、信息行为与信息共享。   3.3 科学发展态势   综合以上对图书情报学11大类研究主题的内容剖析和现状分析,可以看出,现阶段的学科发展主要集中在图书馆实体研究、资源对象以及学科基本信息理论三个方面[4]。而在每个方面下,又有不同的发展侧重点,如在实体研究中,主要是根据系统的观点,将图书馆划分为结构、职能、作用、类型、表现形式各不同的子元素,研究多集中在学术图书馆、图书馆人员和图书馆

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档