异构数据集成方案优化设计与实现.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
异构数据集成方案优化设计与实现

异构数据集成方案优化设计与实现   摘 要:针对现有数据集成方案在处理特定问题时系统查询性能不理想的情况,以Mediator/Wrapper集成模式为基础,结合数据仓库思想,提出1种异构数据集成的优化方案.该方案基于XML和元数据设计查询构造、解析搜索及缓存等模块,优化系统的查询性能.将该方案应用于石油储层评价系统的数据集成中能明显缩短查询的平均耗用时间,提高查询效率.   关键词:XML;元数据;异构数据集成;优化   中图分类号:TP311.13 文献标志码:A      Optimized design and implementation of heterogeneous data integrating solution   ZHANG Jie a,b,LU Detang a,b   (a. Institute of Eng. Sci. Software;b. Key Lab of Computation Communication Software of Anhui,   Univ. of Sci. Tech. of China,Hefei 230026,China)   Abstract:To solve the problem that the current scheme of heterogeneous data integration can not query efficiently in the specific cases,combined with the Mediator/Wrapper architecture and the warehousing method,an optimized solution on heterogeneous data integration is proposed. Based on XML and metadata,several modules such as query construction,parsing and search,and caching are designed to optimize query performance. The solution is introduced into an evaluation system of petroleum reservoir to implement data integration of neural network system of reservoir identification,which can distinctly shorten average query time and improve query efficiency.   Key words:XML;metadata;heterogeneous data integration;optimization      0 引 言      在数据集成项目的开发中经常会遇到这样的情况:待集成数据库的规模大,数据更新不频繁,文件系统数据源较小且分散,用户主要关注的参数较集中,系统对查询效率又有一定的要求.根据这些具体情况,在分析已有数据集成方式特点的基础上,提出异构数据集成优化方案.该方案为所有成员数据源提供统一视图,用户可以进行查询条件的灵活构造,达到异质对象的透明访问;还可以通过相关优化模块提高系统的平均查询效率,减轻系统实时抽取数据时的负荷,并且将此方案应用于油田数据源的集成开发中.      1 异构数据源集成      目前,Mediator/Wrapper[1,2]模式在数据集成中较流行,针对Mediator的设计方案有3种:PUSH,PULL及混合方式.   PUSH方式将用户输入的查询翻译成本地SQL语句,由Wrapper将SQL查询转发给关系引擎.在时间和空间上有很好的性能.但对于非关系型数据源,PUSH方式无法使用.   PULL方式通过Wrapper将数据按照一定格式抽取出来形成XML文档,然后通过XQuery[3]引擎查询转换后的XML数据,由组装器产生最终的XML结果.它完全支持XQuery特性,可以集成任何数据源.但当作为数据源的实时系统运行负荷较重时,抽取数据的效率会很低.   混合方式[4]结合两种方式的特点,其核心部分是区分数据源类型,选择相应的查询方式.这里提出的集成方案就是采用混合方式.使用PUSH方式进行关系型数据源的数据抽取,使用PULL方式进行非关系型数据源的数据抽取,并设计相关模块以避免各自方式的缺点.      2 异构数据源集成系统的设计      2.1 系统结构   根据集成项目的具体情况,结合数据仓库思想,设

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档