- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华南理工大学毕业论文开题报告
华南理工大学本科毕业设计开题报告 一、选题的背景及意义近四十年来,传统的确定性数据(deterministicdata) 管理技术得到了极大的发展,造就了一个数百亿的数据库产业。 数据库技(来自:写论文网:华南理工大学毕业论文开题报告)术和系统已经成为信息化社会基础设施建设的重要支撑。 在传统数据库的应用中,数据的存在性和精确性均确定无疑。 近年来,随着技术的进步和人们对数据采集和处理技术理解的不断深入,不确定性数据(uncertaindata) 得到了广泛的重视。 在许多现实的应用中,例如经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数据扮演着关键角色。 传统的数据管理技术却无法有效管理不确定性数据,这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。 由于不确定性数据的产生原因比较复杂,因此,不确定性数据的种类较多,例如关系型数据、半结构化数据、流数据、移动对象数据等,相应地也出现了许多与数据类型紧密相关的数据模型。 定义与应用场景相匹配的数据模型是不确定性数据管理的首要任务.在不确定性数据管理领域,最常用的模型是可能世界模型(possibleworldmodel) 。该模型从一个不确定性数据库演化出很多确定的数据库实例(称为可能世界实例) ,而且所有实例的概率之和为1.不确定性数据的种类较多,例如关系型数据、半结构化数据、流数据、移动对象数据等,尽管存在许多与数据类型紧密相关的数据模型,但是这些模型最终都可以转化为可能世界模型.其中,基于xml的不确定性数据建模的研究对象主要是半结构化数据模型。 半结构化数据模型(semistructureddatamodel) 能有效描述缺乏严格模式结构的数据。 半结构化数据通常可以用文档树来描述。 Dekhtyar等人提出了一种管理概率半结构化数据(probabilisticsemistructureddata) 的方法,该方法以关系数据库技术为基础,支持丰富的代数查询。 更多的工作则是直接以文档树形式描述不确定性半结构化数据,例如p2文档模型(p2documentmodel) 、概率树模型,以及PXML模型、Keulen等人的概率树模型、PrXML模型等。 二、工作任务分析我在小组中的研究部分是不确定性数据的模型。项目开启后,我的工作与任务可分解分以下几个部分1、学习与整理前辈们在不确定性数据方面的研究成果。这项目工作任务主要分三个阶段进行。第一阶段是广泛地收集与了解不确定性数据的相关知识,了解不确定性数据的轮廓,知道相关的术语、概念,方便以后与别人作相关的交流。 第二阶段是有针对性学习与理整理现有的不确定性数据模型方面的理论知识。这一阶段,要知道各种模型的概念、所针对不同种类的数据、以及它们优势与不足之处。第三阶段是把精力放在不确定性数据研究的某种数据的模型上。 此阶段要做到对相关的模型在较深入的理解,不单要知道他们的定义、优劣、具体应用情况,还要理解它们在数学上表述、证明。 2、对现有的不确定性数据模型提出自己的见解。主要包括以下一系列的活动: 1)仔细研究现在模型的优点与不足之处;2)与其它组员交流看法,尤其是向其它组员了解在不确定性数据的存储与查询方面算法知识,为优化工作提供依据与灵感。3)整理所收集到的不确定性数据模型的资料。 三、调研报告1不确定性数据与xml的发展史实际上,针对不确定性数据的研究工作已经有几十年历史了。从二十世纪八十年代末开始,针对概率数据库的研究工作就从未间断,这类研究工作将不确定性引入到关系数据模型中去,取得较大研究进展。近年来,针对不确定性数据的研究工作则在更广的范围之内取得更大的进展,即:在更丰富的数据类型上处理更多种类的查询任务。不确定性数据管理技术的典型框架包含四大部分:模型定义、预处理与集成、存储与索引、查询分析处理。 可扩展标记语言XML〔1〕是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(StandardGeneralizedMarkupLanguage),是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。随着Web上数据的增多,HTML的缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且更加容易操作以及在WorldWideWeb环境下实现。 1998年,XML成了W3C的推荐标准。 2不确定性数据的发展方向在传统数据库的应用中,数据的存在性和精确性均确凿无疑。近年来,
文档评论(0)