- 3
- 0
- 约5.81千字
- 约 6页
- 2017-08-05 发布于广东
- 举报
水产科学研究的数据采集.doc
水产科学研究的数据采集
1数据采集
文献检索方法最简便也应用最广,但由于机构名称不规范或检索策略不合理,容易带来漏检或误检。科研管理统计数据则多缺乏可供计量分析的字段。因此,将文献检索与科研管理统计两类数据作为基础数据可以最大程度地保证数据的全面性和客观性。由于各数据库收录期刊的范围存在差异,对单一数据库检索容易导致数据不全面。因此,选取中国知网中国学术期刊的网络出版总库和维普资讯中文科技期刊数据库同时作为数据库。检索策略为:机构=中国水产科学研究院or黄海水产研究所or东海水产研究所or南海水产研究所or珠江水产研究所or长江水产研究所or黑龙江水产研究所or淡水渔业研究中心or渔业机械仪器研究所or渔业工程研究所,人工识别分析机构名称的各种不规范写法后,进一步优化检索式,如:黄海水产所实际应为黄海水产研究所,因情况众多不再逐一列举。最后将检索结果分别导入EXCEL表。科研管理统计数据主要来自于各研究所历年统计上报的数据,导入EXCEL表。因此,基础数据包括三部分,分别为中国知网检索数据、维普资讯检索数据和科研管理统计数据,下文将详述基础数据的去重与合并。以黄海水产研究所2007年数据为例,基于文献检索和科研管理统计获得的数据量如表1,可见实际数据量大于每个单独统计的数据量。
2数据清洗
数据清洗的原理是根据回溯思想,通过分析脏数据产生的原因和存在形式,利用现有的技术手段和方
您可能关注的文档
- 机电认识实习报告模板参考.doc
- 机能实验教学中培养学生创新能力方法的研究.doc
- 李书福:给草根创业的两大建议.doc
- 李保国同志先进事迹报告会会议记录材料.doc
- 李保国同志先进事迹报告会完整版视频.doc
- 李嘉诚商业心法招式解析.doc
- 李嘉诚是如何工作的.doc
- 李嘉诚的市值管理术.doc
- 李宁:我不是一个标准的商人.doc
- 李闻郅:一个人的策划和导演.doc
- 2026届甘肃省民勤三中高考化学三模试卷含解析.doc
- 2021年人力资源年终工作汇报 附2026年人力预算测算表 可直接套用.pptx
- 2021年直播间氛围打造提升停留时长培训课件.pptx
- 2026届广西钦州市第二中学高三第二次模拟考试历史试卷含解析.doc
- 2020应对儿童厌学叛逆专属心理健康教育宣讲课件.pptx
- 2026届江苏省南通巿启东中学5月高三月考物理试题.doc
- 2026年初中语文写作课件.pptx
- 2026年电子元件检测实训教程PPT.pptx
- 2026届安徽省肥东县圣泉中学高三下期末模拟联考数学试题.doc
- 广东省惠东县惠东高级中学2026届高三考前热身生物试卷含解析.doc
原创力文档

文档评论(0)