科学数据库数据整合服务策略研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学数据库数据整合服务策略研究 王闰强胡良霖黎建辉侯艳飞陈峰莲 (中国科学院计算机网络信息中心,北京100080) 摘要本文从科学数据库数据整合服务的现状出发,详细探讨了科学数据整合的 策略与方法,在此基础上提出了科学数据“推”服务模式,并且提出应该将科学数 据库信息服务逐步提升为知识服务,将数据库系统提升为知识系统的设想。 关键词 信息服务知识服务数据整合科学数据库 经过10几年的持续发展,中国科学院科学数据库工程已经建成上百个不同数据类型、不 同学科的专业数据库,形成了一个数据量庞大、内容丰富、分布式的、系统异构的科学数据 库群,其内容覆盖天文、地理、生物、化学、物理、信息、材料、资源、环境等多种学科。 如何将庞大、复杂、异构、跨学科的数据库群进行整合以及提供个性化的、智能化的、专业 性的服务,已经是科学数据库发展的重大挑战。 本文从科学数据库数据整合服务的现状出发,详细探讨了科学数据整合的策略与方法, 在此基础上提出了科学数据“推”服务模式,并且提出科学数据库信息服务应该向着多元化、 专业化、智能化、产品化以及个性化的方向发展的设想,要逐步实现由信息服务向知识服务 的提升,这对科学数据库项目将来的发展有一定的借鉴与指导意义。 1.科学数据库数据整合服务的现状 中国科学院1983年提出了“科学数据库及其信息系统”的建设项目,1986年被国家计 委列为国家“七五”和“八五”期间的重点工程项目。同时,中国科学院将其列入“七五” 院重大项目和“八五”、 “九五院基础研究特别支持项目i“十五”期间信息化建设的重 大项目,经过10几年的建设和发展,已经成为目前国内信息量最大,学科专业最广,服务层 次最高,综合性最强的科学信息服务系统。 项目已经建立了界面统一、风格一致、功能强大的数据库信息检索系统平台,同时又将专业 知识和多年工作经验相结合,开发出基于专业数据库的数学模型和专家系统,形成了专业咨 询系统、过程模拟系统、科研信息服务系统等,开展了深层次的专业咨询和增值服务。 由于科学数据库数据量庞大、系统异构,简单的单一数据库检索已经很难发挥科学数据 库的作用,因此,在“十五”期间科学数据库项目提出“标准规范建设对科学数据库数据 进行整合研究,主要采用元数据技术对异构科学数据库群进行描述和规范化处理,制定了核 元数据标准,并开发出“通用元数据管理工具”用以实现基于元数据的科学数据库导航式信 息检索服务,同时实现了元数据的跨库检索服务。但是,这些仅仅是真正进行科学数据库数 据整合的基础,并且由于部分建库单位著录的元数据不完整或者不正确,为后续的数据整合 研究工作造成了一定的困难。 15 到目前为止,科学数据库数据整合的范围与程度都还比较局限,科学数据库中心还只能 提供关于数据库的元数据信息,仅仅发挥了数据资源导航的作用,因此,目前的数据服务基 本上还是由各个建库单位基于各自的数据库独立提供的,还没有充分发挥科学数据库已有资 源的作用。 2.科学数据库数据整合策略 为了能够充分发挥科学数据库数据资源的作用,使科学数据库更好的为科学研究和经济 发展服务,我们必须加强科学数据库数据整合的范围和程度,研究和制定数据整合的策略和 办法,完善元数据标准和著录工具,使其真正满足建库单位的需求。当务之急,应该结合现 有数据整合技术与能力,从数据结构和数据内容上进行整合研究,尤其是应该依据数据内容 进行整合。 2.1组织人力分析已经著录的数据库元数据 在“十五期间,科学数据库项目已经开始了科学数据库的整合研究,初步建立了数据 库的元数据库,这些元数据对数据库的内容、结构、访问参数作了详细的描述,接下来我们 应该组织人力对这些元数据进行分析,依据元数据揭示的信息对数据库进行分类,打破现有 的按单位、按学科进行分类的方式,实现按数据库内容进行分类。 2.2组织人力统计分析科学数据库数据资源 数据整合最终还是应该着眼于数据库中的数据内容,只有真正了解了数据库的真实内容, 才可能开发基于数据库的智能化的检索系统,开展多元化的增值信息服务,因此应该组织人 力分析科学数据库数据资源内容,该工作可与(1)相结合,相辅相成,共同进行,但各自的 测重点不同,前者应注重数据本身特点的研究,尤其是数据质量的分析,对数据

文档评论(0)

聚文惠 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档