- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学数据使用统计应用及关键流程研究
[摘要]科学数据使用统计是科学数据使用计量的重要构成,是科研学术评价的重要参考依据。对比三类数据使用计量的效果及应用难度,文章认为使用统计计量有良好的可信度和可操作性。在梳理研究现状基础上,文章分析数据使用统计的利益相关方,结合数据自身特点,总结流程,并重点阐述数据收集、规范、清洗、报告等关键流程问题,最后提出思考与建议。
[关键词]科学数据;数据计量;使用统计;评价;在线电子资源使用统计
科学数据是现代科学研究的基础支撑之一。它既是科研产出的重要内容,也是后续科学研究、科研创新的基石。近年来,学术界日渐重视科学数据的公开、共享以及重用。科研机构在数据长期保存、数据监护、科学数据开放及数据出版等方面取得诸多实质性的进展。科研人员也逐渐关注科学数据共享及重用所产生的价值,他们关注自己的数据被谁使用,自己的数据价值多高,使用他人的数据是否可靠等问题。科学数据的使用绩效和影响评估已成为推动科学数据公开、共享以及重用的重要助力。
绩效分析与影响评估包括定性与定量两个方面,数据的使用计量则是定量分析的基础。目前,科学数据的使用计量分三类,分别是科学数据的引用计量,科学数据的使用统计以及科学数据的替代计量。它们从不同角度计量科学数据的使用,并提供多样化的数据以便评估。本文关注科学数据使用计量中的使用统计部分,梳理现状,分析关键问题,并探讨如何利用它为机构、学者、科学数据提供商、图书馆等角色提供科学数据的使用绩效评价。
1科学数据使用计量
?F有学术评估体系中,科研人员倾向于认可数据引用和数据下载作为科学数据的影响评价指标。研究数据联盟(Research data alliance,RDA)文献计量学小组的调查发现,研究人员认为评价数据影响力的前三个指标分别是数据引用计量、数据下载和同行评议文章中被提及的数量,社交媒体、博客等使用排序靠后。2014年的另一个在线调查中,95%的研究人员表示引用或者正式出版是获知自己数据影响力的最佳方式,而60%左右的研究者认为数据下载量也是反映自身数据影响力的重要方式。
引用是传统科研学术评估体系中的重要一环,在科学文献领域广泛应用。作为文献领域中成熟的影响力评估数据,引用计量在科学数据影响力评估中也获得优先考虑。科学数据引用计量是三类使用计量中最早进入研究,也获得最多关注。文献方面,几乎所有关于科学数据评价计量的文献都会涉及引用计量,研究角度包括引用规范、引用行为研究、引用评价模型等。实践上,Datacite、英国数据监护中心(The Digital Curation Centre,DCC)、ESIP、RDA、英国联合信息系统委员会(Joint InformationSystems Committee,JISC)等机构对数据引用标准、引用原则、引用应用等方面进行研究实践。Springer、Nature,Elsevier等出版商也在生物医学领域开展数据引用试点项目,获得了许多的一手数据。
尽管数据引用计量被认为是最权威的评估数据来源,然而数据引用计量的广范围应用存在四大障碍。第一,鉴于数据出版成本高、出版流程不完善及研究者缺乏出版动力,科学数据公开出版还不具备广范围实施的条件;第二,尽管DataCite、PANGAEA、Dataverse、ICPSR、中国西部环境与生态科学数据中心、冰川冻土科学数据中心、基础科学数据共享网等重要学术组织、数据仓储和研究机构都提出了相应的科学数据引用和著录标准,但世界范围内缺乏统一的科学数据引用标准;第三,数据引用行为匮乏,许多作者在数据二次分析时不标明数据引用;第四,数据仓储商对科学数据引用的不重视。Making Data Count项目调查了71个科学数据仓储库,结果显示仅有23%的仓储追踪数据引用。
数据下载是科研人员认可的另一大计量数据。它是数据使用统计的主要构成之一。NISO定义数据使用是用户访问以及下载一个公开出版的数据集的行为,其统计范围包括数据的下载、数据访问、数据集标注等。相比引用计量,科学数据的使用统计计量具有预先、直观的特点。预先性指我们可以在数据正式被引用发生前就洞悉数据的可能影响,而直观性表现为我们能够从数据的浏览或者下载直观了解数据或者数据集受欢迎和关注的程度。此外数据使用统计比引用更为广泛。John等调查71个数据仓储,发现90%的仓储提供数据下载统计,仅有23%的数据仓储引用独立数据集,20%的引用将数据仓储作为整体引用。由此看出,数据使用统计比数据引用计量更具可操作性。但使用统计数据并不能完全反映出数据本身质量的问题。数据使用统计具有来源复杂、数据量庞大的特点,尤其需要在统计来源、数据清洗、数据标准等方面进行大量工作,本文第三部分将对这些内容详细阐述。
您可能关注的文档
最近下载
- 《背影》课内阅读训练.doc VIP
- Amason艾茉森电子乐器VP-73GH说明书.pdf
- 《机械臂结构》课件.ppt VIP
- 护理学本科毕业论文范文范文本科护理护理学毕业论文范文.doc
- 11CD008-4 固定资产投资项目节能评估文件编制要点及示例(电气)(OCR).pdf VIP
- 单片机课程设计报告 简易电子琴 .pdf VIP
- 网课章节答案《科学启蒙》超星尔雅答案2023.pdf VIP
- 吉他六线谱空白模版A4 六线 2mm 8行 通用版2打印模板.pdf VIP
- 安全生产规章制度和操作规程完整版.pdf VIP
- 国家开放大学《管理英语4》边学边练Unit 1-4(答案全).docx VIP
原创力文档


文档评论(0)