基于关键词共现的研究前沿识别方法研究鄢.PDF

基于关键词共现的研究前沿识别方法研究鄢.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第远园卷第源 期摇 圆园员远 年圆 月 基于关键词共现的研究前沿识别方法研究鄢 姻 郑彦宁摇 许晓阳摇 刘志辉 中国科学技术信息研究所摇 北京员园园园猿愿 摘要院咱目的辕 意义暂研究分析已有研究前沿识别方法的利弊袁建立一套相对比较合理的研究前沿识别方法 模型袁高效快速地辅助科研管理者和政策制定者识别研究前沿遥 咱方法辕 过程暂在总结研究前沿的定义尧归纳研 究前沿特性的基础上界定研究前沿的内涵袁进而提出识别研究前沿的两个指标院研究主题年龄和研究主题关注 作者数量袁构建基于关键词共现的研究前沿识别方法袁并在蕴耘阅领域进行应用分析遥 咱结果辕 结论暂研究结果表 明该方法不仅可以识别研究前沿袁而且可以有效地跟踪研究前沿的产生尧成长尧消退尧消失过程遥 关键词院关键词共现摇 研究前沿摇 研究领域分析 分类号院郧圆缘源 摇 摇 阅韵陨院员园援员猿圆远远辕躁援蚤泽泽灶援园圆缘圆原猿员员远援圆园员远援园源援园员圆 员摇 引言 沿遥 在基于文本内容的方法中袁基于词频的方法是利 用能够揭示或表达文献核心内容的关键词在某研究领 摇 摇 长期以来袁研究前沿的识别方法主要集中在基 域文献中出现的频次高低以及这些词的时间分布和变 于专家知识识别的定性方法和基于计算机识别的定 化趋势袁来确定该领域的研究发展动向曰基于共词的方 量分析方法两个方面遥 基于专家知识识别的方法在 法是从论文标题尧摘要尧关键词提取的词袁构建共词网 过去的几十年中被广泛地使用袁主要是科学家通过 络并对这些词进行聚类分析袁进而分析这些词所代表 阅读大量文献或者通过交流识别尧判断研究前沿袁这 的学科和主题结构的变化来识别研究前沿曰基于文本 种定性的方法往往会受到科学家主观认识的限制袁 挖掘的方法首先将主题用一组与时间特性关联的特征 而且相当耗时遥 而基于计算机的识别方法主要分为 表示袁然后根据这些特征用文本挖掘技术进行主题抽 基于引用关系和基于文本内容两个方面袁基于引用 取袁最后随时间推移用一定的评价标准来验证主题并 关系的方法包括共被引尧文献耦合以及直接引用袁基 对主题进行分类袁判断主题变化趋势遥 而词语在不同 于文本内容的方法包括基于词频尧共词以及文本挖 的语境下会有不同的含义袁单个词表达的意思并不具 掘咱员暂 遥 虽然基于专家知识识别的定性方法和基于计 体袁单纯基于词频来识别研究前沿的方法过于单薄袁缺 算机识别的定量方法并不相悖袁但是由于基于计算 乏说服力曰基于文本挖掘的方法更加偏重计算机科学尧 机识别的定量方法具有更高的时间和成本效益袁更 数据挖掘领域袁大都是基于文本挖掘的全自动化或半 加适合用来识别研究前沿遥 自动化系统袁还处于起步阶段袁存在很多不足袁比如这 摇 摇 目前基于引用关系的研究前沿识别方法在研究中 些系统并不能自行判断指标的变化趋势来确定研究前 被广泛使用并且硕果累累咱圆原员源暂遥 然而猿种基于引用关 沿袁需要用户根据自己的知识来判断袁有待进一步研究 系的识别方法袁都是在引文层面的聚类分析袁不可避免 和探索遥 地会存在引文识别研究前沿上的潜在弱点院引用与被 摇 摇 考虑到基于引用关系的滞后性尧基于词频方法的 引上的时间滞后袁即一篇文献从出版到被引需要一定 单一性以及基于文本挖掘方法的不成熟性袁本文基于 的时间袁而施引文献从完成到出版又需要一段时间袁这 关键词共现的研究前沿识别方法对 蕴耘阅领域进行实 样基于引文的方法识别出来的结果更趋于热点而非前 用分析遥 鄢本文系国家社会科学基金项目圆园员圆年度青年项目野面向中小企业创新的技术竞争情报方法体系研究冶渊项目编号院员圆悦栽匝园猿园冤研究成果之一

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档