- 14
- 0
- 约9.59千字
- 约 17页
- 2018-10-17 发布于福建
- 举报
新兴主题探测的方法及实证的研究综述
新兴主题探测的方法及实证的研究综述
摘 要:新兴主题目前没有明确统一的定义,它表述为近几年来逐渐引起人们兴趣,并被越来越多的学者研究的主题领域,也可以理解为发现某一特定领域中的焦点、热点,并挖掘最新的变化趋势时主动提示的过程。文章对新兴主题的研究主要集中在两点:一是研究主题的探测方法,如分类与聚类、可视化等,二是关于特定学科的新兴主题实证分析,通过总结现有研究中的不足,指出未来研究新兴主题的研究方向。
关键词:新兴主题 分析方法 分类和聚类 前沿
中图分类号:G353 文献标识码:A 文章编号:1674-098X(2013)03(c)-00-03
从海量的科技信息中探测新兴主题是科技创新的关键任务之一,科研人员及其管理者在进行科学研究前必须要充分了解其研究领域的前沿热点,把握新兴趋势,从而提出有创新性的研究方向和主题。近年来,新兴主题吸引着越来越多的国内外科研组织及研究者讨论研究,关于新兴主题的概念解析、探测方法、分析工具等方面国内外科研组织都相继做出了卓越贡献,但总的说来研究相对孤立和分散,分析总结新兴主题研究成果还不够成熟和完善,因此,对于新兴主题的探测研究和实证分析已是十分迫切与必要。
随着信息时代的发展,2002年Naohiro等人在海量的数据中发掘出新出现的主题,提出新兴主题(Emerging Topics)的概念[1],是指在某个当前正在研究的特定科学领域中,研究者发现新的一组由多个关键词或词组来表示的一组主题领域簇,代表着科学研究中极具发展潜力的研究方向或趋势。A.Kontostathis等学者在2003年提出新兴研究趋势(Emerging Trend):随着时间推移逐渐引起人们兴趣、并被越来越多的学者讨论的主题领域,也可以理解为发现某一特定领域中的焦点、热点,并挖掘最新的变化趋势时主动提示的过程。新兴研究趋势是目前文献挖掘中一个新兴的研究方向,它能够揭示某个特定领域在一定时间内显示出来的研究方向的变化情况。深入挖掘文献集合中包含的时间相关信息具有重要的意义,借助计算机技术去主动探测emerging trend[2]可以提高科研人员和情报人员对科学研究动态及时把握和处理的能力,提示他们注意某些外部事件或者新兴的技术对研究领域的影响,帮助他们快速的探询研究方向的进展情况,有利于其确定或修改研究计划。
Le Minh Hoang[3]引用了Kontostathis对新兴研究趋势的定义,对新兴研究趋势的判断过程分为Topic Representation(主题描述)、Topic Identification(主题界定)、Topic Verfication(主题判断)三个部分,并加入了对关注主体(研究人员、研究机构、文献来源等)的专业性的考虑。他赋予每个主题6个属性值,根据这6个属性值来确定每个主题的受注意程度以及有用性,其中属性值1、3、5、6的平均值衡量受注意程度,属性值2、4、5、6的平均值衡量有用性。属性值依据文献计量学的统计结果和挖掘法计算得出。主题根据受注意程度和有用性属性值可分为:受注意程度和有用性的属性值均大于0为新兴主题;受注意程度大于0 而有用性小于等于0则为潜在的新兴研究趋势(Potentially Emerging Trends);受注意程度和有用性的衡量值均小于等于0 为陈旧的趋势(Obsolete Trends);受注意程度小于等于0而有用性大于0则为不显著但对研究有用的趋势(Creative Trends)。普赖斯认为一个研究前沿大概由40~50篇最近发表的文章组成[4]。
国内研究者对新兴主题概念的理解与国外观点基本一致。杨良选等人认为研究前沿(research fronts,RF),又称科学研究前沿,是指某一时点上某一焦点领域和出现的具有发展潜力的研究方向,研究趋势,是科学演讲中最先进的、最有发展潜力的、最新的研究主题。侯海燕也用研究前沿进行了概况,他根据引文献聚类[5]将其定义为一组突现的动态概念和潜在的研究问题,知识基础(intellecture base)是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹[6]。
1 特定学科新兴主题的实证研究综述
对新兴主题的研究主要集中在两点:一是研究主题的分析方法,如分类与聚类、可视化等,二是关于特定学科的新兴主题实证分析。
国外许多研究机构在新兴主题研究的分析上提出多种方法和原型系统,许多研究机构在新兴研究趋势探测方面提出了多种方法和相关的原型系统,从自动化角度分有需要专家或用户介入的半自动化系统、也有基于机器学习方法的全自动化系统。
国内殷蜀梅[7]认为新兴研究趋势探测的主要指标有:文献中术语出现的频率统计、与主题相关的关键词的共同出现频率
原创力文档

文档评论(0)