- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率xml文档op-k关键字检索算法研究
中文摘要
摘要
目前,互联网中越来越多的数据以XML的格式进行传输和操作,X池结构的
灵活性使复杂的半结构化数据的交换更加方便。但是,在实际工作中,如传感器噪
声数据、信息抽取时包含错误数据的数据源以及图像处理等用XML描述的半结构化
数据会存在一些不确定性。作为不确定性数据研究领域的核心内容,概率XML能够
以明确的方式表示不确定性数据,它是不确定性数据的结构化描述语言。
由于概率XML文档内数据的不确定性,通过传统的XML查询语言已不能够准
确地查询出用户期望的信息。因此,在研究以往)(ML文档的关键字检索算法的基础
上,本文提出了一个概率xML文档Top岳关键字检索模型,该模型主要包括概率
XML文档分区处理、概率XI儿文档关键字索引构建以及概率XML文档Top.七关键
字检索三个部分。
当进行概率XML大文档中关键字检索时,检索时间效率会明显降低,本文引入
普通XML文档的分区技术(XMLPartition),将概率XML文档分区分别存储在相互
独立的服务器节点中,对各分区节点并行执行关键字检索。
为了在概率XML文档关键字索引结构中体现分布结点类型信息,本文扩展了传
统关键字索引编码方法.Dewey编码,设计了一种符合概率XML文档结构特点的关
键字索引编码方法。
XML
Top.七Ke”,0rdSearch)算法,并实现了原型系统。实验结果表明,PTKS算法具
有良好的时间效率,特别是针对复杂结构的概率XML文档的关键字检索时间效率提
升更加显著。
关键宇:概率)(1ⅥL;D删e,,编码;概率XML分区;量小最低公共祖先;关键字检
’
索
英文摘要
ABSTRACT
At tI℃ndthat10tsofda诅istr觚s佗redor in
present,there’s锄i眦re邪ing manipulated
tI他fomlofXMLonthe XMLenablesthe the
Intem吡theflexibilit),of of
exch锄ging
semi蛐ruCteddatadescribed、vith
complicated∞mistflJcted讹conveniently.But,the
XMLcontai憾much in real
the sensor data
uncenainty W0rld,such硒the
noisy da‰the
source、Vithf.ault
data t11einf0肌ationextraction锄dthe the
during imageprocessing.As
work
core oftheresearch0n咖cenain the啪cenain
da饥probabilisticⅪ沮.c锄describe
data itisthe∞miS.tmcted for
description uncenain加.
specificly,觚d
文档评论(0)