元倉库与源数据库的元数据信息的同步策略的研究与设计.docVIP

元倉库与源数据库的元数据信息的同步策略的研究与设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
元倉库与源数据库的元数据信息的同步策略的研究与设计

PAGE PAGE 7 元仓库与源数据库的元数据同步策略的研究与设计 1. 引言 近年来,随着蛋白质组学技术的普及和基础研究的深入,生物信息学正面临一系列新的挑战。对高度复杂的海量蛋白质组学实验数据进行存储、共享与整合即是其中最重要的问题之一。各个数据源在物理上的分布、结构上的互异以及语义上的差异成为了对实验数据进行共享与整合的三大瓶颈。 各个数据源的元数据不仅包含了数据的名称、类型等信息,还提供了数据的上下文描述信息,如果将各数据源的元数据按照一个统一的标准提取出来集中存放在一个元数据库中,将集成的元数据信息与用户建立的用户模式的相应字段进行关联,就能够通过解析用户模式得到对应的各数据源数据信息;将获得的各数据源查询结果进行连接、合并等操作,并按用户模式进行输出,就能够实现数据的共享和整合。根据以上分析,我们课题组提出了基于元数据的蛋白质组学数据资源共享与整合方案,并在此基础上已经实现了针对关系数据库中各异域异构的源数据库中的元数据信息集成到CWM的元仓库模型中。但是元仓库的管理员并不能控制源数据库(以下的源数据库均为关系数据库)中的元数据的变化,如果源数据库的元数据信息发生了改变,而元仓库不能进行及时更新同步的话,就有可能造成元数据的悬挂,对用户的查询结果产生不可估量的影响。我们如何捕获源数据库中的结构变化信息,并将该元数据追加到元数据仓库中去,成为我们解决问题的重点。 2. 现有同步策略的分析与选择 对象变化捕获是数据同步的基础,它直接决定了数据同步的更新方式和选时方式。变化捕获不仅要获得复制对象的变化序列或当前映像,还要在对等式复制时提供尽可能详细的控制信息。通过对当前使用捕获方法的综合分析,目前主要有六种基本变化捕获形式,它们是:(1)基于快照法;(2)基于触发器法;(3)基于日志法;(4)基于API法;(5)影子表法;(6)变更轨迹表法。然而这些变化捕捉的方法均是捕捉数据库中数据的变化信息,我们要求获得的则是源数据库结构的变化信息,虽然这些方法和我们捕捉的对象不同,但是我们可以借鉴它们的原理和方法。由于基于快照发、影子表法和变更轨迹法的核心思想是变化后的数据库信息与原数据库信息进行比较,最终得出变化的结果,这种方法效率比较低下,而且这些方法也不太适合对数据库结构变化的捕捉,所以不采用此种方法。基于API法是,主要应用在小型的非关系型的数据库中,而我们主要面对的源数据库对象都是关系数据库,因此这种方法也不适用于我们。基于触发器法和基于日志法这两种方法运行的效率和通用性都比较的高,但是首先由于基于日志法的实现方法相对而言比较复杂实现的难度较高。其次,是由于现在各主流的DBMS如SQL Server,Oracle,MySQL等都提供了DDL(该触发器主要在响应数据定义语言语句时执行存储过程)的触发器。又考虑到原课题组的成员实现的元数据的导入是通过分析SQL语句实现的,而通过DDL触发器能够获得数据库的变化信息也是以SQL语句形式保存的,综合以上三点,我们最终选择了基于触发器法,来捕获数据库结构的变化信息。这样我们可以利用DDL触发器来记录类似“用户建立表”这种变化的操作。 3. 基于DDL触发器的元仓库与源数据库的元数据信息同步策略的设计 经过以上分析,我们最终选择了基于DDL触发器的元仓库与源数据库的元数据信息同步策略。该方法首先通过各关系数据库的DDL触发器捕获到其元数据的变化信息并保存到源数据库结构变化信息表中,当元仓库的管理者向各数据源发送同步请求时,将信息表中的信息经过SQL语句清理缓冲器整理后,通过网络传送到管理元仓库的服务器中,元仓库服务器最终经过词法分析器将源数据库的结构变化信息更新到元仓库中。元仓库与源数据库的元数据信息同步的流程如图3.1所示: 图3.1元仓库与源数据库的元数据信息同步的流程图 3.1 DDL触发器介绍 DDL 触发器是一种特殊的触发器,它在响应数据定义语言 (DDL) 语句时触发。它们可以用于在数据库中执行管理任务,例如,审核以及规范数据库操作。使用 DDL 触发器,可以达到以下几种目的:第一,要防止对数据库架构进行某些更改。 第二,希望数据库中发生某种情况以响应数据库架构中的更改。 第三,要记录数据库架构中的更改或事件。与标准的DML触发器一样,DDL 触发器在响应事件时执行存储过程。 但与标准的DML触发器不同的是,它们并不在响应对表或视图的 UPDATE、INSERT 或 DELETE 语句时执行存储过程。 它们主要在响应数据定义语言 (DDL) 语句执行存储过程。 这些语句包括 CREATE、ALTER、DROP、GRANT、DENY、REVOKE 和 UPDATE STATISTICS 等语句,然而这些语句正是引起源数据库的元数据信息改变的操作,所以我们通过DDL触

文档评论(0)

yxnz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档