基于XML的概率数据模型研究-计算机软件与理论专业论文.docxVIP

基于XML的概率数据模型研究-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山东大学硕士学位论文摘要 山东大学硕士学位论文 摘要 人类认知存在的局限性、信息描述的差异、度量的误差以及数据的动态变化 等等,往往会产生许多不确定的数据。而随着不确定性研究的深入,未来世界的 不确定性特征逐渐得到现代学术界的普遍认可。但是传统的关系模型对不确定数 据的表示与存储缺乏处理,因此,有关概率数据模型的研究受到了广泛关注,首 先出现了基于关系的概率数据模型,但其结构化的特点决定了它不适用于存储和 处理概率数据。 网络技术的蓬勃发展,更加增加了数据的多样性和不确定性,这些数据往往 有着不同的结构,不同的来源,以及不同的产生原因,所以各数据源之间的规模、 可信度与可用度往往也存在较大的差距,因此需要有新的比结构化方式更适宜的 存储方式。随着XML的出现及快速发展,XML已经普遍用于Web上的数据表 示与交换,而且XML的半结构化、自描述性好及可扩展性高等许多优点,使其 在概率数据表示上与关系概率模型相比较占优势。 目前已有基于XML的概率数据模型的相关研究,但已有模型的查询操作多 局限于单个数据源,对于多数据源情况下的概率数据的管理却缺乏研究。不同来 源的数据,其规模、可信度,以及数据的有效时间,生成时间以及数据源被查询 引用的次数等等,这些信息都应该对多数据源下概率数据的管理产生影响,而不 应被忽略。本文在已有模型思想的基础上,提出了一种扩展的基于XML的概率 数据模型。新模型使得概率查询操作不再局限于单个数据源,而是充分利用各数 据源自身的信用度、规模等信息,支持多数据源情况下XML概率数据间的归并 与查询操作,从而可以提供更加真实有效的信息。 本文的主要工作如下: (1)讨论了不确定性数据的产生途径,并对概率数据模型的研究现状进行了 分析,分别总结了基于关系与基于XIL两大类概率数据模型的特点与不 足。 (2)根据已有模型的思想,提出了一种扩展的基于XML的概率数据模型,给 出新模型的形式化定义及其所要满足的DTD描述,分析其单实例查询及 多实例归并与查询的实现方案与算法。此外,新模型还解决了用XML表 山东大学硕士学位论文示概率数据所引入的数据依赖问题。 山东大学硕士学位论文 示概率数据所引入的数据依赖问题。 (3)对新模型的性质进行分析,证明新模型的操作在该模型上的封闭性,兼 容性与统一性等。 (4)对模型的实现架构与实验环境进行讨论,通过实验,对新模型的查询归 并等操作的性能进行了分析。 关键词:概率;XML;归并:数据依赖;数据模型 II 山东大学硕士学位论文ABSTRACT 山东大学硕士学位论文 ABSTRACT The limitations of human cognition,the differences between information descriptions,the measurement errors and even the dynamic changes of data,Can usually generate many uncertain data.With the in—depth studies on uncertainties,the uncertain characteristic of the future world has been more widely realized in the modem academia.However,it is lack of management of uncertain data in the classic Relational Model.So the probabilistic data models have gradually received widespread concern.The probabilistic relational models eme玛ed first,which are structured and have fiat storages.But they do not apply to storing and processing probability data. Since the network technology develops vigorously,the data variety and uncertainty increased too.These data often have different structures,sources and causes,so the data sources are often uneven and have greater gap in the scale, credibility and availability.So stor

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档