P2P的环境中XML索引问题探究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
P2P的环境中XML索引问题探究

P2P的环境中XML索引问题探究   作为一种可扩展的标记语言,XML具有可扩展、可读性强、半结构化、保值等特点。由于XML采取了用户自定义标签的形式用以定义半结构化数据,这就给予了用户更多的自由来实现更多的个性化选择。因此在实际的网络应用中,XML也越来越多的承载着重要信息。   基于XML的优点,在P2P环境中用户信息、网络地址、数据索引等都可以利用XML进行数据存储及数据交换。我们设想的模型在P2P环境中仅利用XML可以进行完全的数据存储,利用XML建立的索引来提高查询效率,包括图形及影音等类型文件都可以通过XML建立相应的目录对相应信息进行保存,用户的隐私信息可以通过个性化的选择来进行保护。      XML技术      XML(Extensible Markup Language)是指可扩展的标记语言,是互联网中表示结构化信息的一种标准文本格式。它虽然没有复杂的语法和包罗万象的数据定义,但却利用半结构化的数据表达,良好地实现了互联网中的数据交换。著名的商用数据库sQL server、Oracle都实现了与XML数据格式的兼容。所以其越来越多地得到了实际应用。   XML采用了一种用户自定义标签的构建方式,可很好地定义半结构化数据。随着XML技术的不断成熟,关系数据库数据与XML数据的相互转化、XML在关系数据库中的存储和提取、XML索引、XML查询及XMLN生数据库都成为了极为热门的研究领域。   XML语言区别于其他语言的巨大优势还在于其对数据的表达。利用XML,纯文本文件可以用来共享数据。既然XML数据是以纯文本格式存储的,那么xML提供了一种与软件和硬件无关的共享数据方法。这样创建一个能够被不同的应用程序读取的数据文件就变得十分简单了。   当今的计算机世界中,不同企业、不同部门中存在着许多不同的系统。要想在这些不同的平台、不同的数据库软件之间传输信息,不得不使用一些特殊的软件,非常之不便。而不同的显示界面,从工作站、个人微机、到手机,使这些信息的个性化显示也变得很困难。然而利用XML,各种不同的系统之间可以采用XML作为交流媒介。XML不但简单易读。而且可以标注各种文字、图像甚至二进制文件,只要有XML处理工具,就可以轻松地读取并利用这些数据,使得XML成为一种非常理想的网际语言。      XML索引概述      索引是提高查询速度的最重要的工具,由于I/O代价对于数据库操作的重要性,必然要通过DBMS在磁盘上组织数据记录文件来减少I/O代价。索引就是在磁盘上组织数据记录的一种数据结构,用于优化某类数据检索的操作。   XML文件中元素关系基于一种嵌套结构,XML文件被描述成一种节点被标记的树形模型,查询则是一种统一的表达方式,通过文件结构和节点取值来进行对文件的搜索。在大多数的XML查询语言中,XML文档结构都以线性路径或枝叶模式来表达,其中XML元素的取值成为选择谓词的一部分。xML文件是一种半结构化的数据表达,索引的作用就是将XML文档标签甚至内容映射成易于处理的表达方式。为了以清晰的方式阐明XML树形结构中数据彼此之间的关系,人们通常采用数据编码来实现。利用数字编码方式,可以方便地确定出一棵树中祖先与后裔之间的关系。   通过查询来解决对xML数据的搜索,索引的构建方式主要有两种,即结构索引和数字编码。数字编码模式则利用XML的节点位置进行相应地编码。目前大多数的数字编码模式都基于数遍历模式,节点之间的结构关系通过索引编码进行确认。      XML索引优点      XML索引作为一项新兴的研究领域,需要更多的参考及借鉴其他的数据索引方式,并在这个过程中发挥xML半结构化的优势。对XML文档建立索引的优点在于:      (一)维护顺序   对于XML文档中所包含的大规模数据记录,如果被频繁地修改,保存顺序的代价将会有很大的提高,不利于查询(即得到数据集合)。另外当查询的记录集很大,但只包含少量的符合条件的记录,那么效率也会非常低。采用索引方式,不但可以有效地保存数据集合,还可以在索引的同时对某类数据进行提取,从而达到隐私保护的目的。      (二)支持多限制查询   当查询具有多个限制条件时,通过多个索引的限制可以有效地帮助查询快速得到结果集合。避免了重复扫描整个文件来得到记录集。支持一次使用两种不同方法对数据行进行排序。同在关系数据库中相同,由于涉及多表连接查询,就会使得索引的优势更加明显地发挥。未加索引时,我们必须通过多表连接的所有可能数据组合来确定是否满足条件。当多表的数据项数目可观时,就造成了大量的运行时间。引入索引后,只需顺序查找第一个表中数据项,针对该锁定数据项使用其他表上的索引,与其进行关联定位。这样,除了第一个以外的其他表

您可能关注的文档

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档