- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
建立数据驱动e-Science图书馆服务机遇和挑战
建立数据驱动e-Science图书馆服务机遇和挑战
[摘要]在简要评述科学数据增长、存储管理和开放获取需求的基础上,介绍美国麻省理工学院(MIT)图书馆的DSpace图书馆数字资源存储系统和服务新模式,针对科学数据生命周期,提出图书馆建立数据驱动的e-Science图书馆特色服务的思考与策略。
[关键词]e-Science数据驱动 数据存储数据共享 图书馆服务
[分类号]G252
e-Science是信息时代科学研究环境和活动的典型表现。这种建立在先进网格技术基础之上的数字化科研新环境,通过网络技术及相关中间件实现程序,形成环形的科学知识流,具有可重复的周期性,创建完毕的数据或知识由机构存储库或个人知识存储库存储后再调用,它突破了时间、空间障碍,使得科研人员不必考虑资源的存储地和提供者,就可自由使用分布在其他远程计算机上的科学数据资源,协同组织开展科学研究。在e-Science环境下,动态、交互、协同的网络化、数字化使基于网络化的信息交流、组织、分析、合作成为科研活动的核心纽带和新形式,更有利于催生新的发现,从而加速科学发展的进程。人类基因组计划的成功实施和完成以及空间科学、全球环境等研究,都是e-Sci.enee环境科学研究发展的范例。在e-Science环境下,科研用户的信息需求和科研模式发生的根本性改变给图书馆带来了新的重要发展机遇和挑战。因此,建立e-Science下新的服务理念和技术平台,已成为现代科学图书馆发展的趋势。笔者将结合美国麻省理工学院(MIT)图书馆服务项目实践活动,提出一些建立数据驱动的e-Science图书馆服务的粗浅看法。
1 e-Scienece环境下科学数据存储与开放共享的现状
1.1 科学数据产出呈指数级增长
科学数据包括科研论文、专利、研究报告、实验观测数据和元数据、参考资料、照片和图表、学术类多媒体资源等,不仅包括公开出版和可公开获取的数据,还包括很多的灰色科学数据。近年来,随着各国的科技投入增大,科学观测和分析能力已得到快速的提升,导致科学数据的产生和积累呈指数级增长。仅以科学实验数据增长为例,最近MIT图书馆员调查了该校一些重要领域科学家的数据量,发??16个案例中的科学家每年产生数据总量大约为41 000 TB(即4.1X1O16B),如物理系教授的数据量为20 600 TB,神经影像学教授为5.4TB,气候变化研究的科学家产生200TB。研究还发现,与过去5年相比,每个学科的数据量都增加了5―10倍以上。在e-Science环境下,科学数据面临着存取、传输和数据管理三个方面的挑战。
1.2 科学数据共享和长期保存的重要举措
科学数据共享和长期保存已被视为各国促进科技创新的重要举措。美国鼓励科学数据实现全面开放,欧洲国家对科研信息化和数据管理也非常重视。我国也在积极推行e-Science下科学数据的开放获取。为促进科学数据的开放共享,许多国际知名研究基金会要求所资助的研究项目将科研数据向公众开放,例如,美国国家科学基金会(NSF)于2010年已明确规定,今后基金申请都必须要提交数据的长期保存和开放获取计划。2009年11月,41位诺贝尔奖获得者联名发出致美国国会的公开信,支持研究成果公共获取法案;目前已有24个国家的150多个机构参加了国际高能物理界推出的学术期刊开放出版计划――SCOAP3计划。实现科学数据的共享和有效管理不仅仅是要将数据存入适当的知识库中,更重要的是通过数据开放共享促进科学新发现和开展高效的合作研究。
1.3 科学数据保存的进展和现状
目前科学数据存储和共享已取得许多重要进展。一些大型国际合作项目实现了使用层结构系统(tieredsystem)或计算机集群进行数据存贮和共享。一些出版商要求研究人员将发表文章的科学数据存到指定的官方数据库中保存并共享。如在生物学杂志上发表文章,作者被要求文章投稿前将基因测序结果递交GenBank数据库。另外,一些官方专业机构和学协会也推出了相应的学科数据知识库(data reposity,DR),如:Pubchem(化学),Genbank、PDB(蛋白质数据库)、SIMBAD(天文学领域)、GEON(地学)等。但这些科学数据库平台的数据格式并不统一,也并非都采用了元数据,如GenBank的缺点是数据主要是平面文件而不是元数据,格式单调,并不适合保存生物交叉学科领域的数据。因此,数据不规范和缺少跨学科的统一平台是当前科学数据存储共享的主要障碍。事实上,还有一些研究人员仍在使用廉价的备份系统进行数据备份,或将大量的科学数据分散保存于不同的计算机、文件夹中,效率低、安全性差。有部分研究人员把数据存于Coogle、Amazon、Mi-
您可能关注的文档
最近下载
- 专题02 宇宙中的地球-5年(2020-2024)高考1年模拟地理真题分类汇编(北京专用)(解析版).docx VIP
- 城市绿地分类标准 .pdf VIP
- 营养指导员题库.docx VIP
- 专题01 地球和地图-5年(2020-2024)高考1年模拟地理真题分类汇编(北京专用)(解析版).docx VIP
- 四年级【语文(统编版)】古诗三首(第一课时)课件 .pptx
- 质量管理体系工具统计技术.pptx VIP
- 2022年茅台考试真题及答案——计算机专业.pdf
- 发电机短路试验中转子接地保护误动作分析及关键问题探讨.pdf VIP
- Silvaco傻瓜教程—张林—长安大学—2018.06.pdf
- SpringBoot学习笔记(实用完整版).pdf VIP
文档评论(0)