- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据融合技术的科技查新辅助工具的开发.doc
基于数据融合技术的科技查新辅助工具的开发
摘 要:笔者研发的科技查新辅助查新工具是针对中国知网、万方、维普、中国知识产权局专利检索与服务系统设计的,通过编程实现基于EXCEL平台的查新辅助工具,该工具能够读取各数据库不同格式的数据、对数据进行去重、并在去重时抽取不同数据库的内容融合成最完整的数据进行保留,最后按照统一要求的查新格式导出。该工具相较于时下流行的辅助查新软件,其输出内容更完全,同时还具有方便快捷、无需安装、操作简单易学等特点。
关键词:查新 去重 EXCEL 数据融合
中图分类号:TP311 文献标识码:A 文章编号:1672-3791(2014)11(c)-0005-03
Based on Data Fusion Technology for Development of Novelty Search Auxiliary Tool
ZhangRui
(Library of Fujian Agriculture and Forestry University)
Abstract:The novelty search tools is aimed at deleting duplicate in the serch results of CNKI, WanFang and VIP database, The system based on EXCEL platform, and can read the database data in different formats, and delete duplicate, finally export the result according to the novelty format. This method is more convenient and quick compared with the popular novelty search software, and dont need to install, and easy operation etc., also can make up for the inadequacy of existing software at the same time.
Keywords:Novelty Search;Delete Duplicate;EXCEL Data fusion
随着文献数据的不断增长,科技查新工作变得越加复杂和重要。计算机辅助查新系统不仅可以帮助查新员节约大量重复工作的时间,还可以修正查新员在大工作量下容易犯的错误。
目前,国内的查新辅助软件主要集中在在线委托与查新档案的管理方面[1-13],检索结果去重和统一查新格式导出方面的软件较少,仅见哈尔滨工业大学图书馆应用JAVA语言开发了《图书馆中文查新智能去重系统》[14]。虽然许多收费软件如NoteExpress和NoteFirst均有查重去重功能,但购买费用较高,且在各大数据库所提供的基于NoteExpress和NoteFirst格式的数据字段不全的情况下,无法按照查新员需求输出符合规范的查新结果。一些国外收费软件如EndNote由于使用习惯不同,也不太符合国内查新员的需求。另一方面,国内的文献数据库检索平台的检索结果格式不统一,同一检索式得到的结果存在许多重复,若要人工一一筛选去重、整理格式,则费时费力,且容易出错。
1 目标
笔者研发的辅助查新工具是针对中国知网、万方、维普、中国知识产权局专利检索与服务系统设计的基于EXCEL平台的查新辅助工具,其通过双重的数据融合可使输出的数据内容最完整。
该辅助查新工具旨在实现以下目标。
(1)读取各个数据库(中国知网、万方、维普、中国知识产权局专利检索与服务系统、Innography专利分析平台)不同格式的数据,每个数据库的两种格式的数据将在同一在表格中融合,最后只以一张表格显示;
(2)导出各个数据库的数据,导出的数据应符合科技查新的参考文献著录规则;
(3)根据标题对数据进行去重,在去重时抽取不同数据库的内容融合成最完整的数据进行保留,去重结果直接显示在EXCEL表格里,方便查新员调整,若有不符合需求的数据可直接删除;
(4)按照科技查新要求的格式导出去重后的结果。
2 系统功能模块的实现
2.1 EXCEL宏语言简介
EXCEL宏可以使用VB Script指令集编写针对Office组件的小程序,它是VB编程语言的子集,可以使用VB的常用语句编写程序,编写方式与C++类似,依靠EXCEL原有的数据处理功能,可以编写出强大数据处理系统,而且编写出的系统根植于EXCEL平台,相似的
文档评论(0)