XML查询处理和优化.pptVIP

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
XML查询语言XQuery的查询处理和优化 报告内容 研究的意义 XML数据管理及其研究内容 国内外研究现状分析 我的选择和工作重点 已有的工作和准备 进度安排 1.研究意义 跨平台,不同机器上的应用互操作,Web信息处理自动化 特点(和HTML比较) 可扩展性,自描述,递归结构,数据有效性 应用 数据集成,应用集成,数据交换,历史文件存档 大量XML数据涌现 政府,商业文档,电子书,数字图书馆书目信息,电子商务数据,Semantic Web数据,Ontology数据,Ubiquitous… 一个例子 bib book year=1994 titleTCP/IP Illustrated/title author lastStevens/lastfirstW./first /author publisherAddison-Wesley/publisher price 65.95/price /book /bib 2.XML数据管理和研究内容 2.1XML数据管理 2.1.1查询 2.1.2增加,删除,修改 集成:没有更新,比如Mediator 交换:与传统的DBMS相比,批处理较多,查询多,已有一些研究结果Software AG。 Mediator-Wrapper relational datasource1 研究内容 2.2研究内容 1.数据模型(W3C) 特点:多面手,关系,对象,文档 2.Schema 3.查询,更新语言(W3C) 4.查询处理和优化 5.索引组织和存储管理 6.性能评价:Benchmark 3.国内外研究现状分析 历史 国内外研究现状分析 半结构化数据的存储和查询 国内外研究现状分析 半结构化数据管理的特点 0.基于图的数据模型 1. 没有固定的Schema,,需要用Data Mining算法从实例数据中提,如DataGuide,STORED, 2.查询语言一般都有很复杂的路径表达式,正则表达式 3.兼具IR的特色,Proximity Search,索引复杂 4.结论:复杂,收效甚微 5.XML已出现,都转向XML 6.与XML的区别 大多的XML数据都有Schema 国内外研究现状分析 XML的存储和查询 国内外研究现状分析 性能比较和Benchmark 国内外研究现状分析 工业界 国内外研究现状分析 工业界支持的特点 基于模板映射的方法,手工作映射,能够利用关系数据库存入,取出XML数据。 最新结果 IBM’s Almaden research center Microsoft’s SQL Server2000 自动映射, XQuery查询关系数据的XML视图 各种方法分析 各种方法分析比较 有schema强于没有schema 没有schema也要尽量提取一个不完整的Schema来 纯文本 半结构的web数据 关系数据 弱 中 强 Schema 的作用:查询处理,优化,数据布局,结果浏览 4我的选择和工作重点 我的选择 选择有schema的XML数据 克服关系数据库管理XML数据的缺点 有效的支持XQuery查询处理和优化 就发表的论文来看以前没有人做过这个工作,有可能正在进行还没有发表结果 有很多新的机会和难得经验 讨论 XML数据管理的特征 和关系数据库比较 关键:带Tag的嵌套结构元素的提取和 构造 工作重点 查询处理 查询代数算子,等价公式,基于规则的逻辑查询优化(选择谓词push down,投影去掉不需要的元素) 优化算法 统计信息,成本估计,基本算子的选取,启发式方法减小搜索空间,动态规划算法寻找最优 物理查询计划。 索引结构及其维护 数据布局 有效支持带Tag的嵌套结构元素的提取和 构造 以前的工作,可利用的资源和准备 用关系数据库来存储XML数据 XQuery语言的parser W3C’s XQuery, XSchema 各种schema,dtd,XML测试数据,benchmark 数据生成工具 Berkeley DB Toolkit(B+ Glimpse全文检索工具(支持contain函数) 排序,索引,优化算法例程 关系数据库实现技术 技术来源 Database system implementation(ullman, stanford) Database system concepts(silberschatz, bell lab) File structures:an analytic approach(salzber

文档评论(0)

lingyun51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档