- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
存储管理以记录为单位
OrientX: Native XML数据库系统 孟小峰 王宇 罗道峰 陆世潮 安靖 陈妍 蒋瑜 欧建波 中国人民大学信息学院 (100872) xfmeng@ Outline 体系结构和特征 存储 索引 SUPEX结构索引 结构索引使用的编码方法 查询处理 导航式查询处理 集合式查询处理 基于代价的查询优化 更新 基于角色的访问控制 OrientX特征 基于模式 采用多种粒度的树形结构存储数据 支持描述化查询语言XQuery 基于代价估计的查询优化方法 基于模式的路径索引 基于角色的访问控制 … 体系结构 数据存储管理 索引模块 查询处理 数据更新 用户访问控制 模式管理 接口 Outline 体系结构和特征 存储 索引 查询处理 导航式查询处理 集合式查询处理 基于代价的查询优化 更新 基于角色的访问控制 OrientX 存储策略 存储管理以记录为单位,逻辑含义是一棵子树,是读写的最小单位 一个XML文档包含若干个记录,多个满足同一个模式定义(DTD或者XML Schema)的XML文档放在一个数据集里。 EID(AID)唯一地标志结点的类型 数据集用SetID来标志;在文件上划分逻辑物理块物理块用LpNo来标志;给定一对SetID,LpNo,能马上找到对应文件的相应的偏移量。 多粒度存储策略 四种存储方法 Element-based Depth-first Element Based(DEB) Clustered Element Based(CEB) Subtree-based Depth-first Subtree Based (DSB) Clustered Subtree Based (CSB) 多粒度存储策略 存储策略的选择 不同的文档适合用不同的方法来存储 当文档比较小的时候,采用深度优先方法 当文档比较大的时候,使用聚簇方法 文档性质比较强的文档,采用深度优先方法 数据性质比较强的文档,采用聚簇方法 为了处理上的方便,无论底层采取什么存储方法,对上层查询的接口都是一样的,这样,提供了一定的独立性。 Outline 体系结构和特征 存储 索引 查询处理 导航式查询处理 集合式查询处理 基于代价的查询优化 更新 基于角色的访问控制 SUPEX索引策略 父子关系 祖先-后代关系 绝对路径查询 相对路径查询 编码方法概述 三类编码方法: Region-based: start, end, order, size Prefix-based: Dewey-code K-ary-tree-based: PBiTree 基于编码方法的索引和查询技术: EE-Join,EA-Join 和 KC-Join MPMCJN SHCJ, MHCJ,VPJ stack-merge 结构索引使用的编码 BitPath 思想:prefix-based方法 好处: 与region或者k-ary tree方法相比,变长、更新代价小。 与其它prefix-based方法相比,不需要分隔符,减少存储空间,提高查询效率。 Outline 体系结构和特征 存储 索引 查询处理 导航式查询处理 集合式查询处理 基于代价的查询优化 更新 基于角色的访问控制 处理XQuery的核心问题 Path路径的求值问题 结构连接 基于树的导航式处理 嵌套查询的解决方案 相关嵌套 非相关嵌套 XML数据的有序性问题 XQuery查询导航式实现方法的主要模块 语法分析 语义检查 生成执行计划 优化器 逻辑的 物理的 执行引擎 导航式处理XQuery的结构图 产生执行计划的算法 构建执行计划 并不是先生成语法树再构建执行计划。 而是,语法分析的同时构建执行计划。 当规约成一个语法单元时,即构建一个相应的操作符 把构成该语法单元的子单元的对应操作符,置为新构建操作符的子操作;形成一棵执行计划树 例子 import default schema = xmark for $p in document(xsmall.xml) //people /person Let $i := $p//interest where $p/profile/@income 10000 return person profile{$p/profile} /profile {$i} /person 执行计划 导航式处理 导航式处理 导航式处理 Outline 体系结构和特征 存储 索引 查询处理 导航式查询处理 集合式查询处理 基于代价的查询优化 更新 基于角色的访问控制 集合式查询处理 借鉴关系代数方法,引入XML 代数,使操作变成一次一集合的操作。 XML Algebra 设计 设计思想 主要问题 难点 设计思想 引入关系中关于记录的概念,操作符的操作对象是记录的
您可能关注的文档
- 国科会自然处数学学门业务概况简报.ppt
- 基于提升学生外语能力与学习动机的‘多国语字典网站’设计与建置.PDF
- 国际几大芯片公司力推智能电网技术.doc
- 国际事务同仁工作坊.ppt
- 国际合作设计项目需求说明.doc
- 基于时间维度局部特征的人体行为识别-西安理工大学学报.PDF
- 基于栅格填充的直角多边形建筑物轮廓规则化方法-武汉大学学报.PDF
- 国际自助售货系统与设施博览交易会.doc
- 土壤和地下水修复项目总承包方.pdf
- 在教改深水区—英才教育的出路.ppt
- 2021-2022学年湖南省常德市安乡县四年级上学期期中语文真题及答案.pdf
- 2023-2024学年河南省南阳市社旗县四年级上学期期中数学真题及答案.pdf
- 2022-2023学年云南省曲靖市四年级下学期期末数学真题及答案.pdf
- 2021-2022学年河南省周口市鹿邑县二年级下册月考语文真题及答案.pdf
- 2018年河南焦作解放区教师招聘考试真题及答案.pdf
- 2019年江西公务员行测考试真题及答案-乡镇.pdf
- 2019中国石油报社应届高校毕业生招聘试题及答案解析.pdf
- 光大银行招聘应届毕业生能力素质测试笔试真题及答案.pdf
- 2024年广西百色教师招聘考试模拟题及答案.pdf
- 2021-2022学年浙江绍兴诸暨市五年级上册语文期末试卷及答案.pdf
文档评论(0)