- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
11111111111111111111111111111 XML索引文档有效的结构化连接 摘 要 基于路径表达式、元素之间结构关系及编码模式获取XML文档结构 基于标识索引提出了有效的结构化连接算法(B+,B+sp,B+psp) 引入兄弟指针(避免不参与连接的元素的操作)改善连接性能 基于R-Tree的结构化连接算法 1 引言 XML是有序树,具有复杂的结构,对数据库研究是挑战 树结点对应XML文档元素或属性 基于值(元素名、属性和文本串)的选择和结构(父子、祖先和后代关系)的选择两种查询 Section[title=“Overview”]//figure[caption=“R-tree”] 传统的B+Tree索引模式容易扩展支持基于值的查询,路径表达式支持结构查询 引言 以前提出的结构化连接算法的缺点 假设祖先和后代关系在序列连接之前给出 通过I/O操作访问祖先和后代元素 连接性能低下 算法改进 假设连接序列索引存在 序列元素属于同一文档标识且标识索引易于维持 通过编码模式索引能解析元素之间的关系 连接之前过滤掉无用的结构信息 引言 本文主要贡献 提出基于B+Tree的有效的结构化连接算法(B+,B+sp,B+psp) 有效的引入兄弟指针改善算法性能 实验证明B+psp算法最好 本文组织 1节 引言 2节 回顾相关工作(XML文档、编码模式、算法) 3节 提出基于B+Tree的有效的结构化连接算法 4节 讨论了基于R-Tree的结构化连接 5节 实验 6节 性能分析 7节 结论和未来工作 2 背景及前人工作 编码模式 XML文档树中结点指派三个编码:前序、后序和层次 v是u的祖先结点: 且 v是u的父结点: 持久编码模式 每个结点指派一个间距(interval): v是u的祖先结点: 即 v、u是兄弟结点且u是前驱结点: XML文档结构图(持久编码模式) [2,9],[601,709],[1201,1399],[2001,2099],…用于更新操作 持久编码模式特点和作用 编码模式作用 对于不同的结点u、v,满足; u的间距或在v的间距之前或在v的间距之后 u的间距或包含v的间距或被v包含 u、v间距不能部分相交 结构化连接 结构化连接:满足祖先(A)-后代(D)关系 Section[title=“Overview”]//figure[caption=“R-tree”] 祖先-后代模式 确定满足祖先-后代关系 对于任意 满足: (i) (ii) 若是父子结点,需满足: 结构化连接是优化XML查询的核心 (merge join, sort-merge join算法) 已有算法 Stack-Tree-Desc算法 引入stack机制 Stack-Tree-Desc算法示例 3 基于B+Tree的结构化连接 基于 组合的索引B+Tree 结构化连接中索引的应用 (a) 祖先被跳过 执行stack-tree-desc算法 (1) a1,a2,a3入栈并同d1连接; (2)a3,a2出栈;(3)通过a13检查元素a4;(4)a14入栈,a1,a14同d2连接 (b) 后代被跳过 执行stack-tree-desc算法 (1) a1入栈并同d1连接; (2) a1出栈;(3)通过d13检查元素d2 ;(4)a2入栈,同d14连接 基于B+Tree的连接算法 核心思想 祖先入栈 11、15步骤使用B+Tree跳过祖先和后代 14步骤栈一定为空,否则发生错误 嵌套包含森林(C-forest) 结构 同一标识下的元素连接结构 每个元素对应C-forest结构中一个结点 通过父结点、第一个孩子、右兄弟指针连接其他元素结点 结 构 图 C-forest 结构 np为n的父结点,满足: np是n的祖先,即 没有其他祖先结点na ,使得np是na的祖先 nc为n的第一个孩子结点,满足: nc是n的子结点 不存在其他子结点位于nc之前 ( : n1位于n2之前) ns为n的右兄弟结点,满足: n与ns有同一父结点 在n与ns之间不存在具有同一父结点的结点 ( :n2位于n1 ,n3之间) C-forest性质 每个(start,end)间距包含子树的所有间距 C-forest的Start编码遵循前序遍历 兄弟结点start(end)编码是增序 B+Tree中嵌入C-f
您可能关注的文档
- 第二章七大营养素.ppt
- C#编程设计课件5.ppt
- 万科地产成本培训系列之设计版.ppt
- 6.增词法 amplification.ppt
- (业务类新员工)职业心态与工作观念.ppt
- Ref_气浮设计.ppt
- 张建立结直肠癌微创治疗新视点.ppt
- JavaSE_9_IO流.ppt
- TDSCDMA系统基础知识.ppt
- qishang1.2.3复习.ppt
- 2026华泰证券Fintech金融科技人才专场校园招聘笔试备考试题及答案解析.docx
- 2026江苏辖区农村商业银行江阴农村商业银行校园招聘85人笔试备考试题及答案解析.docx
- 2025下半年广东中山市检察机关招聘劳动合同制司法辅助人员11人笔试模拟试题及答案解析.docx
- 2025西安辛家庙社区卫生服务中心招聘笔试参考题库附答案解析.docx
- 2026建发致新校园招聘笔试备考试题及答案解析.docx
- 2025西双版纳州景洪市文化和旅游局招聘城镇公益性岗位人员(2人)笔试参考题库附答案解析.docx
- 2026江苏辖区农村商业银行张家港农村商业银行校园招聘80人笔试备考试题及答案解析.docx
- 2026临沂市郯城邮政招聘笔试备考试题及答案解析.docx
- 2025下半年国家矿山安全监察局四川局下属事业单位考试招聘5人笔试模拟试题及答案解析.docx
- 2025西北工业大学航天学院空天光机电与多学科一体化团队招聘1人(陕西)笔试参考题库附答案解析.docx
最近下载
- 序篇 不忘初心 课件高一音乐人音版(2025)必修音乐鉴赏(共19张PPT)(含音频+视频).pptx VIP
- 15J101、15G612砖墙建筑、结构构造(OCR).docx VIP
- 赛那用户手册-2404版(01999-08059).pdf VIP
- 鼎捷易飞成本核算流程正式版.pptx VIP
- 工程咨询公司薪酬管理制度.pdf VIP
- 2025至2030中国碳纳米管行业市场深度调研及发展前景与投资报告.docx VIP
- McgsPro软件使用教程_V1.0.pdf VIP
- 桥面铺装层裂缝原因分析及预控措施探讨.doc VIP
- 光伏电站消防安全课件.pptx VIP
- 监理通知单模板.docx VIP
文档评论(0)