XML数据的查询转换及实用化研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF内部资料。支持编辑复制,值得参考!!!

摘 要 XML (eXtensible Markup Language )可扩展标记语言是一组定义语义标记 的规则,这些语义标记将文档划分为多个部分,并且标记出文档的不同部分。 XML 也是一种元标记语言,可以定义特定领域内的标记语言的语法结构。XML 作为事实上的数据表示和交换的标准,具有简洁、灵活和结构化的优点,被看 作是未来通用的数据格式,在 Web 上也具有良好的应用前景。有关 XML 的各 种处理技术成为大量研究者关注的热点问题。除了易于建立和易于分析外,XML 主要的优点在于它既与平台无关,又与厂商无关。这种特点使它在电子商务领 域又有着十分广阔的应用前景。因此,XML 也不仅引起了学术界,也引起了企 业界的广泛关注。事实上,XML 为 Web 的数据管理提供了全新的数据模型, 将 Web 变成一个真正的数据库是这一领域工作的终极目标。但是,随之而来的 是 Internet 中海量的XML 文档,如何对这些文档进行有效管理与快速查询,是 当前学术界的研究热点。 XML 与数据库界近年来研究的半结构化数据(semi-structured data)极为相 似,半结构化数据己有的理论和原型系统可以作为 XML 研究的基础。人们可以 将 XML 看作是半结构化数据的标准,并借鉴半结构化数据的研究成果来管理 XML 数据。目前,数据库界在半结构化数据的研究方面己取得了一定的进展, 包括数据模型、查询语言、半结构化的模式、查询和查询优化技术、索引技术。 但是,目前的半结构化数据的研究尚不成熟,并且 XML 与半结构化数据相比, 在数据特点及应用领域上又存在一些差别。因此,需要对 XML 数据作进一步深 入的研究。 XML 的特点使其可以跨硬件、跨系统、跨平台,但在此过程中需要的频繁 的操作是XML 的查询、处理及转换。到目前为止,还没有易于得到的XML 查 询或转换以供使用。虽然 W3C 制定了 XML 的查询标准 XQuery ,但是必须要 经过系统地学习 XQuery 的语法规则才可以使用,并且其语法较为复杂。同样, 对于 XML 的转换来说,W3C 的 XSLT 使用起来也较为复杂,在程序设计过程 中也无法通过可视化的操作来制定XML 文件的转换模板。因此,在目前的应用 系统当中,很多地方都会涉及到 XML 的一些查询转换等具体应用,而这些应用 需要一些简单的易获取的方法来实现。 本文在整个 XML 体系的理论与规范的基础上,深入研究 XML 的查询、转 1 换及一些实用性技术。在分析现有 XML 查询语言的基础上,提出了一种 XML 的查询模型。并且使用VS.NET2008 (美国微软公司于2008 年发布的最新的系 统开发平台)创建基于 XML Web Services 的通用模块,来实现XML 的验证、 查询及转换等功能。系统中借助于.NET Framework 中的XML 的相关类,来充 分利用现有的 XML 标准与规范。这样,针对于目前已有的研究成果由于没有中 间标准,各个系统的实现人员几乎没有可能将代码重用的情况,通用的 XML 查询与转换的模块,将可以方便地在系统二次开发的过程中使用。 同时,本文在分析现有的 XML 索引的基础上,提出了一种扩展的基于 Schema 的 XML 索引的方法 XSBXI ,该方法充分利用 Schema 的信息提高路径 查询的效率。XSBXI 采用了新的 XML 编码方式,将 Schema 文件与 XML 文件 分别编码。这使得 XML 文档中的每个元素或属性的编码都携带了相应的 Schema 结构信息,并根据 Schema 中所确定的元素可出现的最大次数maxOccurs 来减少查询的次数,进一步优化查询。系统的实现采用关系数据库来存储编码 方案,充分利用了关系数据库的强大功能。XSBXI 的结构查询一般要分两步实 现:先与 XML Schema 进行结构匹配;再对相应的 XML 文档进行查询处理。 本文也给出了基于 XSBXI 的查询处理的详细过程。 最后,本文提出了通用的 XSLT 转换模型,通

文档评论(0)

文献大师 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档