- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
XMLJAVA作业-丁有军,最终版.doc
海 南 大 学
XML中使用版本树的twig version匹配查询
题 目: XML中使用版本树的twig version匹配查询
学 号: 09081203210008
姓 名: 丁有军
年 级: 09级
学 院: 研究生院
专 业: 计算机应用
完成日期: 2010 年 6 月 11日
XML中使用版本树的twig version匹配查询
中国科学技术大学,Xin Wu,Guiquan Liu,合肥。
摘要:
XML已经成为网络上信息描述和信息交换的标准,XML的查询优化是该领域研究的一个重要课题。
当前XML查询算法的一个普遍问题是,随着XML文档内容的增加,查询的执行时间和空间也会相应地增加。
在本文章中,我们提出了用版本标签模式和twigversion算法来解决这个问题。其中版本标签模式进一步构成版本树。XML中使用版本树的twigversion算法查询。
关键词:
version labeling-版本标签、version tree construction-版本树、twig pattern matching-twig算法样式匹配
XML(可扩展标记语言)是Extensible Markup Language的缩写,是由W3C
(Word Wide Web Consortium,万维网协会)制定的,是一种类似于HTML的标记语言。XML没有固定的标签集合,它提供了一种通用的、灵活的语法机制,用户可以根据自己的需要定义自己的文档结构,它是一种跨平台的,与软、硬件无关的,处理信息的工具。XML将成为最普遍的数据操纵和数据传输的工具。XML在今天的Web开发中无处不在,将成为计算领域的未来。作为一种技术,它的影响力将渗透到编程的每个方面,从嵌入式系统到图形界面,到分布式系统以及数据库管理,它实际上已经成为软件工业之间数据通信的标准,并且迅速代替EDI(electronic data interchange)Internet上,并且有可能成为Internet应用程序服务器的基础。XML不仅是置标语言,而且是可扩展的置标语言。XML使用文挡类型定义DTD(Document Type Definition)或者模式(Schema)来描述数据,当使用DTD或者Schema后就是自描述的语言。
XML数据的特点之一是半结构化,半结构化数据是介于完全结构化数据和完全无结构的数据之间的之中数据形式,具有自描述性。一些数据源如web的数据并非像传统的结构化数据那样有严格的数据格式和数据类型,即为半结构化数据。
XML的优势之一是它允许各个组织、个人建立适合自己需要的标记集合,并且这些标记集合可以迅速地投入使用。这一特征使得xml可以在电子商务、政府文档、司法、出版、CAD/CAM、保险机构、厂商和中介组织信息交换等领域中一展身手,针对不同的系统、厂商提供各具特色的独立解决方案。XML的最大优点在于它的数据格式存储不受显示格式的制约。一般来说,一篇文档包括桑格要素:数据、结构以及显示方式。XML把文档的三要素独立开来,分别处理。
过去,研究XML查询的两个主要领域是,structural index和numbering schemes。对于这两个方法,当前XML查询的算法主要是twig pattern matching算法,我们提出新的算法,twigversion,也是属于twig pattern matching算法类型。并且还包括了structural index和numbering schemes两个方法。
原来的XML文档由于结构组织庞大,数据量多,所以在查询的时候,我们需要将原来的XML文档稍微整理一下,整理出易于我们查询的形式,并且保证数据本身不丢失,数据内容不减少,具体说来也就是在信息的组织方面,我们将所有的信息都存储在版本树里面。这个版本树是我们自己构造的,易于查询的XML文档形式,在使用版本树后,所有的信息都只放在版本树里,当然,任何从原始XML树中读取节点信息都没必要了,对使用twig version算法来说,后来用户在查询目标信息的时候,就要从这个已构造的版本树里面开始查询。构造版本树是
原创力文档


文档评论(0)