水产科学研究的数据采集.docVIP

  • 3
  • 0
  • 约5.81千字
  • 约 6页
  • 2017-08-05 发布于广东
  • 举报
水产科学研究的数据采集.doc

  水产科学研究的数据采集 1数据采集 文献检索方法最简便也应用最广,但由于机构名称不规范或检索策略不合理,容易带来漏检或误检。科研管理统计数据则多缺乏可供计量分析的字段。因此,将文献检索与科研管理统计两类数据作为基础数据可以最大程度地保证数据的全面性和客观性。由于各数据库收录期刊的范围存在差异,对单一数据库检索容易导致数据不全面。因此,选取中国知网中国学术期刊的网络出版总库和维普资讯中文科技期刊数据库同时作为数据库。检索策略为:机构=中国水产科学研究院or黄海水产研究所or东海水产研究所or南海水产研究所or珠江水产研究所or长江水产研究所or黑龙江水产研究所or淡水渔业研究中心or渔业机械仪器研究所or渔业工程研究所,人工识别分析机构名称的各种不规范写法后,进一步优化检索式,如:黄海水产所实际应为黄海水产研究所,因情况众多不再逐一列举。最后将检索结果分别导入EXCEL表。科研管理统计数据主要来自于各研究所历年统计上报的数据,导入EXCEL表。因此,基础数据包括三部分,分别为中国知网检索数据、维普资讯检索数据和科研管理统计数据,下文将详述基础数据的去重与合并。以黄海水产研究所2007年数据为例,基于文献检索和科研管理统计获得的数据量如表1,可见实际数据量大于每个单独统计的数据量。 2数据清洗 数据清洗的原理是根据回溯思想,通过分析脏数据产生的原因和存在形式,利用现有的技术手段和方

文档评论(0)

1亿VIP精品文档

相关文档