试论科学知识图谱文献计量学研究范式.docVIP

试论科学知识图谱文献计量学研究范式.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
试论科学知识图谱文献计量学研究范式

试论科学知识图谱文献计量学研究范式   [摘要]针对目前科学知识图谱研究范式多元化、主流研究范式是基于引文分析理论的文献计量现状,对该研究范式的理论基础、基本研究框架和主要研究策略三个方面进行理论性阐释和思考,以促进国内研究实践中所存在问题的解决。   [关键词]科学知识图谱 文献计量学 科学计量学   [分类号]G301   1 引言   近现代以来科学技术的迅猛发展,使科学活动本身逐渐成为一个重要的学术研究对象,得到来自不同领域学者的广泛关注,并由此诞生了一门崭新的学科――科学计量学(scientometrics)。世纪之交,信息可视化技术的异军突起及其在学科发展历史描述、学科(专业)结构分析、前沿研究趋势探测等诸多科学计量学研究课题中的成功应用,将科学计量学推进到一个更高的研究发展阶段――基于可视化工具的科学知识图谱绘制(mapping knowledge domains)。   所谓“科学知识图谱”,是用于显示科学知识的发展进程与结构关系的一种图形,具有“图”和“谱”的双重性质与特征:既是可视化的知识图形,又是序列化的知识谱系,可对知识单元或知识群体之间存在(或形成)的网络结构及其互动、交叉、衍化等诸多复杂关系进行表达和描述。事实上,有关科学知识图谱的早期研究可以追溯到20世纪60年代。1964年,Gaffield E等人就开始尝试应用引文分析方法研制一个精确有用的、导致特定学科取得重大进展的累积性研究的网络图,以便考察它在科学史和学科结构关系分析等方面的有效性,并以Isaac Asimov博士的《遗传密码》一书作为研究基线,手工绘制完成了DNA研究领域的知识演进图谱;1965年,Price D也运用类似的引文数据和方法完成了其经典论文――“Networks of Seientific Papers”的写作,文中对物理学和它的一个分支领域的结构进行了分析。这些早期具有开创性的研究活动,对科学知识图谱的后续发展起到了非常巨大的影响和推动作用。   目前,国内外的科学知识图谱研究异常活跃,研究人员的来源学科广泛,研究视角及范式也非常多元。例如,以文献调研和综述分析为主的传统研究范式;以Merton R K创立的科学社会学(sociology ofscience)为基础的理论研究范式;基于引文分析的书目(或文献)计量(bibliographical or bibilometrical)范式;基于复杂网络(complex network)理论的社会网络分析范式,等等。作者认为,尽管研究范式非常多元化,但对于目前的科学知识图谱研究而言,文献计量学研究范式(以下简称“Bib范式”)应是其中最为重要的一种。因此,本文主要就该研究范式进行论述分析,涉及内容包括Bib范式的理论基础、基本研究框架和主要研究策略等。   2 Bib范式的理论基础   科学史的研究工作表明,科学的发展和知识的增长具有明显的继承性和累积性,任何的知识创新与技术进步,都是在原有科学或技术基础上发展、分化和衍生出来的。另外,科学的统一性原则也可以证明,不同的学科之间存在着广泛的交叉、关联和渗透。那么,作为由全部人类智慧积累而建立起来的这样一个复杂而庞大的科学系统,它的特性、知识结构、演化规律及发展趋势等,是如何被记录、保存和展示的?我们又该如何对其进行研究和探索?答案无疑是简单的――科学文献及其计量分析。众多科学文献集合起来,形成了对科学及其研究活动的一种客观表示;而科学文献之间普遍存在的引用和被引用关系,则隐含反映了科学知识之间的内在关联性。不难设想,一旦大量的文献及其引用数据被聚集起来,并基于各种数学和统计学方法以及可视化工具的加工处理之后,就可以形成对特定文献集合及其引文网络(citation network)结构规律的显性化揭示,进而解决相应科学知识图谱的有效绘制问题。自20世纪60年代以来科学知识图谱的大量研究实践也证明,基于引文分析的文献计量学方法,因无需专业知识、可基于计算机系统处理大规模数据以及方法自身的客观性等,为科学知识图谱绘制提供了一种崭新而有效的研究范式。      那么,如何来认识和评估Bib这一研究范式的有效性及合理性?其理论基础是什么?对这一问题的回答,我们可以从1999年瑞典学者Wouters P在其博士学位论文中对“科学表示”问题的研究中找到答案。他认为,对科学(活动)的“表示”(representation)可以概括抽象为如下的三个不同层次:①第一级表示(first order representation):科学文献(scientific literature);②第二级表示(second order representation):引文分析(citation analysis);③第三级表示(thir

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档