网站大量收购独家精品文档,联系QQ:2885784924

NSTL外文期刊引文数据自动化拆分的研究与实践.pdfVIP

NSTL外文期刊引文数据自动化拆分的研究与实践.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NSTL十年专刊 http: // NSTL外文期刊引文数据 自动化拆分的研究与实践 □ 鲜国建 赵瑞雪 金晨/ 中国农业科学院农业信息研究所 北京市 100081 摘要:文章简要分析了NSTL国际科学引文数据库的建设现状,讨论了期刊类型引文数据自动化拆分 的必要性和可行性,深入研究了期刊类型引文的著录规律,提出采用分类的思想将引文数据划分为不 同类型再分别加以拆分,设计出自动化拆分的具体流程和技术框架,实现了自动化拆分工具,并在农 学领域进行了自动化批量拆分的应用实践,增强了大规模数据的自动化处理能力,提高了数据的整体 质量及时效性。 关键词:NSTL,国际科学引文数据库,引文数据,自动化拆分 DOI:10.3772/j.issn.1673—2286.2010.10.019 引言 核心期刊,覆盖了理、工、农、医、标准和计量各领 域。从2006年开始建设至今,DISC 已累积加工建设引 引文即文献末尾所附的参考文献,它是文献的 文数据3000余万条,且这个数字在不断快速地增长。 必要组成部分。引文客观地描绘出科研工作中文献 以中国农业科学院农业信息研究所 (以下简称农科) 的利用关系,揭示科学研究及其成果之间的传播、借 承担的农学领域为例,2009年共完成了300余万条的加 [1] 鉴、继承和发展的脉络 。通过对引用的参考文献检 工任务。在NSTL引文数据库著录规则中明确要求,揭 索,将全文文献与引用的参考文献链接起来,可实现 示的参考文献种类要全面,包括期刊、图书、会议、 基于参考文献的源文献查找,实现文献所述知识点的 标准、学位论文、网络资源、专利文献、科技报告以 追根溯源,是拓展信息资源、提高获取知识效率的有 及其他类型;著录的字段要准确翔实,包括引文的类 [2] 效方法 。此外,引文还是评价科研人员和科研机构 型、作者、题名、出处、年、卷、期、页码、出版 学术地位的重要指标。因此,N STL高度重视引文数 地、出版公司、主编和网络信息等多个著录项;加工 据库的建设,自2006年开始投入建设国际科学引文数 语种除了英、法、德等主要西语语言外,还要涵盖多 据库 (Database of International Science Citation ,简称 种小语种文献。可以说,引文数据加工的数据规模巨 [4] DISC )。DISC是集文献发现、引文链接、原文传递为 大,文献种类繁多且语言类型复杂 。因此,NSTL各 一体的服务系统,为我国科研人员提供世界科学研究 成员单位花费了大量的人力、物力和时间,以此来保 的脉络,为方便他们了解世界先进国家研究的动态与 证顺利完成各自的引文数据加工任务。 [3] 研究方法提供了重要途径 。本文从微观的角度探讨 目前大多数加工单位在数据加工过程中,仍以人工 了在建设DISC 的过程中,如何改变以手工为主的加工 方式为主,计算机为辅,这种加工方式不但效率较低, 方式,提高引文数据加工的自动化水平,缩短加工周 且质量难以保证,人员培训成本也较高。当前各单位的 期,提升引文数据的整体质量。 加工任务已基本处于饱和状态,一旦需要增加加工品 种,目前的加工方式则将难以应对。因此,各加工单位 1 引文数据库建设现状 有必要进一步优化改善现有的加工流程,改变以人工为

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档