- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
异构数据源集成系统查询优化
异构数据源集成系统查询优化摘要 异构数据集成系统需要处理大量的数据,且各数据之间的结构大不相同,严重影响了查询速度,因此必须采取优化措施改善查询效率。本文结合实际,谈谈利用缓存技术和预取技术对查询进行优化的思路。
关键词 异构数据源;集成系统;查询优化
中图分类号TP392 文献标识码A 文章编号 1674-6708(2012)73-0223-02
伴随着计算机网络的不断普及和World Wide Web的出现,导致若干Web异构数据源形成,异构数据源集成为这些自然分布的异构数据源提供了完整的模式和较为一致的接口,可以消除异构、实现数据源的透明分布。对于系统查询而言,网络信息量的大幅增加与网络延迟二者之间形成了强烈的反差及矛盾,导致网络拥挤不堪,使得网络用户难以获得应有或理想的服务效果。异构源数据源集成系统中,由于不同数据源具备着不同的查询功能及不同效率,使得系统往往需要进行大量的数据处理工作,因此必须对系统的查询功能进行优化。
为使其延迟性得到系统改善,优化过程中必须以缩减系统处理用户请求的时间为前提基础。对于计算机网络中存在的各种不同存储结构的数据,所有异构数据源集成系统均可以实现集成,因此对于HTML、XML文件等半结构化数据源,DBMS等可处理结构化数据源和文本文件等非结构化数据源等都能处理[1]。异构数据集成系统需要处理大量的数据,且各数据之间的结构大不相同,严重影响了查询速度,因此必须采取优化措施改善查询效率。本文结合实际,谈谈利用缓存技术和预取技术对查询进行优化的思路。
1缓存技术
通常情况下将程序中响应消息的本地存储区以及控制传输信息存储、删除或获取的子系统,也即是指临时文件交换区[2],将其定义为缓存。利用缓存保存可以对消息进行缓存响应,能够降低网络的带宽消耗和将来的响应时间,对于请求消息也同样适用。
异构数据源集成系统具有很高的数据查询能力,能够实现对大量HTML、XML以及文本文件等进行处理,通常情况下,该类数据文件的查询速度较慢,所所有的查询均从局部数据源进行检索,其速度必然很慢。异构数据源集成系统利用缓存技术提高数据查询速度,它有效的实现所有用户对全局视图查询结构的缓存存放,同时对新结果不断更新,以此来替代数据源中的旧有的结果,从而有效提高缓存中数据的检索命中率。在缓存中,保存查询所需的全局视图名和选择条件,如果用户的查询与这些条件符合,可以由缓存直接读取查询结果。如用户所需的查询结果未存在于缓存中,然后再将查询内容进行分解,并将分解后的结果送至各数据源,以此来获取整个数据查询结果。通常缓存中可以命中的查询结果越多其查询速度也就越快,这与缓存采用的替换算法有很大关系。在选择缓存的的替换算法时,可以进行如下考虑:
1)局部视图变化后,对缓存中旧的内容进行修改;2)当数据源中的数据不断更新时,比较适合采用LRU替换算法;3)由于不同数据源的数据具有不同的访问,由此看来传统的LRU算法亟待改进,根据不同数据其访问品读的不同,将Cache块划分成不同的区域,同时将所有数据源均单独分配一个独立区域,同时该区域内容只允许请求结果进行替代。
通过缓存技术的应用,有效改善了系统性能,然而任何事物都有其两面性,缓存技术也一样,当缓存中所对应的存储局部视图出现了一定变化时,就会产生缓存中的数据结果与局部数据源数据结果不一致的现象,必须进行刷新。针对这一情况,根据不同的应用需求,异构数据源集成系统采取按需刷新和定期刷新的方式进行数据源的刷新。定期(根据数据源信息更新的时间确定)对局部视图检查,看其是否有所变化,同时根据其变化来对缓存内容作出相应的修改,对于一些需要快速响应的查询处理,可从缓存种中直接进行数据的读取。当然缓存内容一般会对局部视图在两次刷新前改变的情况不能进行很好的反映。如果是一些对精准度要求极高的查询需求,定期的刷新显然已无法满足用户的需求了。异构数据源集成系统则可以弥补其不足,通过按需刷新的方式,若出现新用户查询请求时,首先对缓存中视图变化进行检查,若缓存视图中未出现变化情况,可直接提出缓存中的相应数据结果,如果缓存中查不到所需结果,则对查询进行分解,在各个数据源中查询更新后的数据,同时修改缓存的内容。
2预取技术
缓存技术具有统一模式的机制特点,预取技术弥补了它的这一不足,在提高互联网信息检索速度上受到越来越多的重视,在备受关注的Web检索系统中有着十分广泛的应用[3]。其技术理论依据为:首先使用者在向服务器发出两次HTTP请求间存在一定的使用者空闲和思考时间,其长度一般为几秒到几分钟不等。若想将此段时间充分利用,即将使用的文件提前进行取回,并将其存放于缓存中,以此来减少相应等待的时间。也即是将用户即将访问的数据,在用户的请求发出之前,先放置于缓存中,当用户对其
您可能关注的文档
- 建筑给排水节能问题浅谈.doc
- 建筑给排水设计中节水措施探究.doc
- 建筑给排水设计中环保问题.doc
- 建筑给排水设计及施工中常见问题浅谈.doc
- 建筑节能及低碳建筑探究.doc
- 建筑节能及供暖系统间关系探究.doc
- 建筑节能及外墙保温施工技术要求.doc
- 建筑节能及节能建材研究.doc
- 建筑给排水设计问题探析.doc
- 建筑节能工程施工模式探究.doc
- 2024甘肃农业职业技术学院招聘笔试真题及参考答案详解.docx
- 2024驻马店职业技术学院招聘笔试真题及答案详解一套.docx
- 2024河北机电职业技术学院招聘笔试真题带答案详解.docx
- 2024无锡南洋职业技术学院招聘笔试真题及完整答案详解1套.docx
- 2024新疆建设职业技术学院招聘笔试真题及参考答案详解一套.docx
- 2024年黑龙江护理高等专科学校招聘笔试真题含答案详解.docx
- 2024杭州职业技术学院招聘笔试真题参考答案详解.docx
- 2024广西水利电力职业技术学院招聘笔试真题及参考答案详解一套.docx
- 2024昆明工业职业技术学院招聘笔试真题及参考答案详解.docx
- 2024河南轻工职业学院招聘笔试真题附答案详解.docx
文档评论(0)