连续概率xml数据查询技术分析与应用-analysis and application of continuous probability xml data query technology.docxVIP

连续概率xml数据查询技术分析与应用-analysis and application of continuous probability xml data query technology.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
连续概率xml数据查询技术分析与应用-analysis and application of continuous probability xml data query technology

摘要近年来,随着数据采集和处理技术的不断发展,人们对数据的认知也开始发生改变,数据的属性开始由确定性向不确定性转变。在互联网、经济、金融、电信等许多现实应用中,不确定性数据普遍存在,而且有着非常重要的作用。传统的关系型数据库具有结构化的特点,难以适用于不确定性数据的管理。而XML具有易扩展、灵活性和自描述性等优点,是结构化和半结构化数据进行交换、存储的主要数据形式之一,更适合于不确定数据的表示。目前,使用连续概率XML对不确定数据进行管理越来越受到研究者们的关注,其中高效的查询方法是一个重要研究目标。本文研究是在研究生阶段参与的具体项目背景下,基于现有的XML编码和查询技术,针对连续概率XML数据的特点,提出了一种改进的编码和查询算法。具体工作有以下几个方面:在编码方面,提出一种新的基于p-文档模型的素数编码方案EPBH(ExtendedPrimesCodingBasedonHierarchy)。在实际应用中,XML文档会经常更新,目前的很多编码都不能很好地支持更新操作。EPBH编码在素数编码的基础上,加入了层次关系,并且重复利用小素数,实现了对XML文档更新操作的支持,也避免了素数编码本身编码值增长过快的问题,而且能够很好地判断节点之间的结构关系。在查询方面,提出了一种基于EPBH编码的扩展小枝查询算法—PCTwigList。,在XML数据管理中,小枝模式查询是XML查询处理的核心操作,主要分为归并和非归并两大类,其中TwigList是一种经典的基于区间编码的非归并算法,但TwigList算法的不足之处在于构造节点链表集合的过程中只考虑了节点间的A-D(Ancestor-Descendant)关系,而没有考虑节点间的P-C(Parent-Children)关系,在对概率XML数据的查询过程中会产生大量的中间结果。PCTwigList算法针对这些问题进行了改进,在整个查询过程中进行三次过滤操作,大大减少了中间结果,提高了查询的效率。本文通过大量的对比实验,证明出EPBH编码和PCTwigList算法的高效性。最后通过在实际项目中的应用和实现,进一步验证了方法的有效性和可用性。关键词:连续概率XML,EPBH编码,查询处理,PCTwigList算法ABSTRACTInrecentyears,withthecontinuousdevelopmentofdataacquisitionandprocessingtechnology,peoplesperceptionofthedataisgraduallychanging,anddata’sattributeisshiftingfromcertaintytouncertainty.Inmanypracticalapplications,suchasInternet,economy,financeandtelecommunication,etc.theuncertaindataiscommonandplaysakeyrole.Thecharacteristicoftraditionalrelationaldatabaseisstructural,whichisinadequacyforthemanagementofuncertaintyinthedata.AndXMLhastheadvantagesofextensibility,flexibilityandself-describing,whichmakesitbecometheoneofdataexchangeandexpressionmainstreamforms,andalsoitisparticularlysuitablefortheexpressionofuncertaindata.Atpresent,usingcontinuousprobabilityXMLdatatomanagetheuncertaindatahasbeenthefocusofresearchers.andhowtodevelopefficientquerymethodsistheimportantresearchobjectives.Researchcontentofthisarticleisunderthebackgroundofaspecificprojectinmygraduate.Themaincontentisanimprovedcodingandqueryalgorithm,onthebasisofexistingXMLcodingandquerytechnologyandthecharacteristicsofcontinuousprobabilityXML.Thecontenthasthefollowingseveralaspects:I

您可能关注的文档

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档