- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF内部资料。支持编辑复制,值得参考!!!
摘 要
随着XML 应用的不断增加, XML 已经成为互联网上数据表示和交换事实
上的标准,许多结构化或者半结构化的数据都以 XML 格式表示和传输。为了从
大量的 XML 数据中找到感兴趣的信息,可以通过已有的关键字查询或者结构化
查询(如 XPath 、XQuery 、SQL/XML 等)方式获取需要的信息。
虽然关键字查询简单易用,但其有限的表达能力导致查询结果中包含大量与
用户期待不一致的结果,而从大量结果中识别感兴趣的结果对用户来说几乎是
不可完成的任务。结构化查询方法虽然可以准确表达查询需求,但前提是用户
必须掌握文档的组织结构。而 XML 文档组织的灵活性导致用户难以完全掌握具
体的文档结构,具体表现在:XML 文档结构的复杂性、信息的对称性和 XML
文档组织结构的不对称性、XML 文档结构的不断演变性。这些以上问题的存在
使得普通用户在使用结构化语言表达自身查询请求时,面临无法有效获取信息
的尴尬境地。
为了克服已有方法在用户不了解文档具体组织结构的情况下进行查询处理
时存在的不足,本文通过扩展 XPath 语法提出了一种基于新的相关性(related)
语义的近似查询处理方法。与已有的 XPath 语法中的轴所表达的语义不同,
related 语义更多关注的是用户需要的数据,并非这些数据在文档中的具体物理
组织关系,因此,用户使用 related 语义来表达查询请求,无需了解文档的具体
组织形式。这种扩充的好处有以下三点:(1)如果用户了解文档结构,则其可以
准确表达自身查询请求。(2)如果用户不了解文档结构,则其可以通过 related 语
义表达自身查询请求。(3)如果用户仅了解部分结构,则其可以通过 related 语义
和已有的 XPath 语法中的轴语义的组合来尽可能准确的定位其所需的数据。
本文研究在新的 related 扩充语义下的近似查询处理技术,提出了一种基于
related 语义的 Twig 查询处理方法。对于 SQL/XML 查询处理中涉及的 XML 查
询,首先分析 XML 查询与 SQL 查询之间的关系,然后根据 SQL/XML 查询处
理的特殊前提,即数据字典的存在,对原来提出的 Twig 查询处理方法进行优化,
从而提高了 XML 查询处理的效率。
本文的贡献可概括如下:
1.提出一种新的 related 查询语义来扩充已有 XPath 语言的表达能力,这个
扩充语义在用户不太了解文档的具体组织结构的情况下为用户提供了简单易用
的查询表达方式;
2. 提出一种新的高效查询处理算法 rTwigStack ,该算法只需扫描一遍元素
即可得到所有满足条件的结果;
3. 分析在 SQL/XML 查询处理中的XML 查询处理涉及的操作符进行简单的
分析,可知 XML 查询处理可以与 SQL 查询处理独立进行,使得在 SQL/XML
中进行近似查询处理具备可行性;
1
4. 在 SQL/XML 查询环境下,提出基于 Schema 模式信息的一种优化算法
rTwigStack+ ,能够根据XML 的模式信息将related 关系转化为 A-D 或者 P-C 关
系,从而提高查询效率;
5. 通过丰富的实验数据对本文提出的算法根据不同的评价标准进行了验
证,实验结果表明,本文所提出的方法可以高效处理包含 related 轴的查询,同
时可以高效处理包含已有各种轴的查询。
关键词: XML,相关性语义,近似查询处理
2
Abstract
With the rapid increasing of Web based applications, XML is now the de-facto
standard of Web data representation and exchange, and XML Query technology
文档评论(0)