叶春蕾12冷伏海1中国科学院国家科学图书馆北京100190.DOC

叶春蕾12冷伏海1中国科学院国家科学图书馆北京100190.DOC

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
叶春蕾1,2 冷伏海1 (1.中国科学院国家科学图书馆,北京 100190;2.北京城市学院,北京 100094) 基于共词分析的学科主题演化方法改进研究 The Improved Study on the Theme Revolution Based on Co-word Analysis 摘 要:学科主题演化是情报分析人员采用一定的信息技术方法观察主题在时间维度上的发展、变化趋势以及不同主题之间的交互作用,它已成为情报研究的一项重要内容。基于词频或共现词频的共词分析方法难以反映主题词对间更层次的语义关系,针对这一情况, 本文提出一种改进的共词分析方法,该方法可以体现出主题词、主题和文档间的层次语义关系,以更微观、精确的语义层面展现主题演化过程。 关键词:共词分析;主题演化分析;LDA;信息量 Abstract: The theme revolution analysis of disciplines has become one of the most important content of information research, for which the intelligence analysts observe the developing and changing trends of one theme and the interaction between different themes based on time dimension. And the co-word analysis based on word frequency or co-occurrence frequency is difficult to reflect the semantic relation between terms. In this case, the study propose an improved method for co-word analysis to reflect the semantic relation between the levels of terms, them and document in order to present theme evolution in more microscopic and accurate way. Keywords: co-word analysis; theme revolution analysis; LDA; information quantity 社会进步离不开科学技术的发展,而科学技术的发展总是建立前一时期发展的基础之上,如何对科学领域未来的发展进行超前思维,如何为国家战略决策提供重要情报支持,如何为科学家和政府企业的高层管理者提供审视学科布局,制定宏观战略决策提供重要参考。对于这些亟待解决的问题,情报人员可以利用情报学和其他学科相关研究方法动态跟踪科学领域主题演化规律,揭示学科知识发展变化及其相互作用的特征与规律,追溯学科发展轨迹,以发现可能的新知识增长点提供技术支撑。 科学技术文档是科学技术发展过程中知识的主要载体,是科学技术发展过程的累积形态。对于科学技术演化关系的计量分析,文档是最好的途径。表征知识内容的文档特征主要有引文、分类和概念词,在对这三种文档特征对比研究中,笔者认为对于微观知识的演化关系分析的准确把握更有赖于主题词的分析。因此,基于主题词的主题演化分析方法是本文研究的主要切入点。 1 主题演化分析方法 主题演化分析可以为学科未来发展和战略决策提供重要的情报支持,如何有效地发挥情报分析方法在主题演化分析的作用仍需要做深入的研究。目前对学科主题演化分析的科学计量手段有多种,其中最主要的两种基本方法是共词分析和共引分析。 共词分析的基本原理是对统计一组词两两在同一篇文献中出现的次数, 以此为基础对这些词进行聚类分析, 从而反映出这些词之间的亲疏关系, 进而分析这些词所代表的学科和主题的结构变化。它利用大量文献中共同出现的关键词对有效地反映文本关键词之间的关联强度, 减少了关键词的空间, 用一套结构图有效地展示了关键词之间的关联[1]。 共引分析的基本原理主要是以具有一定学科代表性的一批文献为分析对象。基于共引分析的学科主题演化分析方法是以文献同被引次数为分析内容来研究学科主题演化的方法。共引分析方法首先被应用于揭示科学结构,绘制科学结构图。也就是依据共引关系,使用网络图的方式揭示一个学科、领域、专业、单个文献和作者之间的相互关联关系,将它们的相关性用物理邻近和相对位置关系的方式表示出来。通过连续时间内共引聚类图的历时比较,反映科学结构的演化过程[2]。 笔者认为对于学科主题演化规律的揭示,必须深入知识体系内部,从知识单元即主题

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档