- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
: 。l0l一 ◆ 舞
基于路径表达式的XML查询优化模型研究与设计
ResearchandDesignofOptimizationModelBasedon Path Expression
范新灿 杨丽娟
(深圳职业技术学院电信学院 深圳 518055)
摘 要 现有的XML查询技术效率不高,查询优化的研究成为业界热点和难点问题 。本文基于路径表达式进行优
化研究 ,设计 了一个查询优化模型 XQO,对 XML查询过程进行查询解析 、逻辑优化 、物理优化。通过优化算法模 型的
设计优化策略,解决了海量 XML查询优化存在 的一些问题 ,并从实验结果对优化模型进行验证 。
关键词 XML 查询优化模型 路径表达式 查询树
中图分类号 TP311
l XML查询 化。
2 xQO优化模型设计
查询优化是实现查询高效的关键性 因素,XML文件的
查询与传统的查询有所不同。XML数据是 自描述的,内容 传统数据库查询优化的查询语言首先被转换成一种 内
与结构混杂在一起,数据具有完整的嵌套层次,标记 内的数 容表达形式 (通常是某种代数 ,如关系代数),根据转换规则
据都可看作一个元素,而每一个元素都可作为数据的索引, 得到等价表达式,计算不同形式表达式 的执行代价 ,然后选
查询的对象是具有结构信息且架构上不规则的XML数据 , 择一个最小的执行方案,这种方 法运用到 XML查询优化
查询结果可以只是一个文件 的相关 片断 ,与传统查询不 同 时,还需要解决几个问题。首先是完善查询代数标准,XML
体现在: 半结构化的特点是完善代数 的难点;其次是对查询代价的
a.XML查询条件中既包含查询关键字 ,又包含结构化 精确估计,XML查询结果大小与 I/O次数之间对应没有规
查询条件 ; 律 ,影响代价估计 ;还有一个难点是缺乏足够的统计信息,由
b.XML数据查询结果返 回的结果可能是 XML数据 的 于XML数据缺乏模式的支持和本身半结构化的特点 ,需要
某个元素,而不是整个文档 ,而且该结果元素可能是 XML 把对结构的统计信息和对值的统计信息进行结合 ,才能得
数据树中任意层次的元素,这样对于支持检索的索引结构 到足够精确的统计信息。
的建立、词汇频率 的统计及词汇权重的计算带来一系列问 参照传统的数据库系统查询处理过程 ,在 xoo模型
题 ; 中,将 XML查询查询处理分为 4个大的阶段 ,查询优化过
c.XML数据查询结果的排序对象是 XIVlL中的各个元 程的模型及采用的相应优化技术如图 1所示。对于每个阶
素而不是文档,计算查询结果 与查询相关度与传统查询不 段进行优化处理 ,对应 的优化过程为 以下阶段…:
同; 查询解析阶段:将 XML查询转换为某种 内部表达式,
d.XML查询 以路径表达式为查询核心的语句包含不 内部表达式通常 以一种抽象语法树或查询树 的形式 出现 。
确定元素 ,路径复杂,包含分支路径等。 本优化模型采用对 XML代数进行优化。XML代数是对遵
现有 的XML数据处理通常把 XML查询转变为数据库 循一定数据模型的XML文档集合的操作集,提供根据请求
查询表达,由查询优化器优化查询并执行 ,再将查询的结果 在文档集合 中选择一个或多个文档或者文档片段 的能力,
转变为 XML数据 ,但这种多级转换造成效率 的降低和查询 并支持对查询结果的
原创力文档


文档评论(0)