开题报告,华工 开题报告 .docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
开题报告,华工 开题报告

开题报告,华工 开题报告 篇一:华南理工大学本科毕业设计开题报告 华南理工大学本科毕业设计开题报告 一、 选题的背景及意义 近四十年来,传统的确定性数据( deterministic data) 管理技术得到了极大的发 展,造就了一个数百亿的数据库产业。 数据库技术和系统已经成为信息化社会基 础设施建设的重要支撑。 在传统数据库的应用中,数据的存在性和精确性均确定 无疑。 近年来,随着技术的进步和人们对数据采集和处理技术理解的不断深入, 不确定性数据( uncertain data) 得到了广泛的重视。 在许多现实的应用中,例如 经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数 据扮演着关键角色。 传统的数据管理技术却无法有效管理不确定性数据,这就引 发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。 由于不确定性数据的产生原因比较复杂(可能是原始数据本身不准确或是采 用了粗粒度的数据集合,也可能是为了满足特殊应用目的或是在处理缺失值、数 据集成过程中而产生的),因此,不确定性数据的种类较多,例如关系型数据、半 结构化数据、流数据、移动对象数据等,相应地也出现了许多与数据类型紧密相 关的数据模型。 定义与应用场景相匹配的数据模型是不确定性数据管理的首要任务. 在不确 定性数据管理领域,最常用的模型是可能世界模型(possibleworld model) 。该模型 从一个不确定性数据库演化出很多确定的数据库实例(称为可能世界实例) ,而且 所有实例的概率之和为 1. 不确定性数据的种类较多,例如关系型数据、半结构化 数据、流数据、移动对象数据等,尽管存在许多与数据类型紧密相关的数据模型, 但是这些模型最终都可以转化为可能世界模型. 其中,基于 xml 的不确定性数据建模的研究对象主要是半结构化数据模型。 半结构化数据模型( semistructured data model) 能有效描述缺乏严格模式结构的 数据。 半结构化数据通常可以用文档树来描述。 Dekhtyar 等人提出了一种管理 概率半结构化数据(probabilistic semistructured data) 的方法,该方法以关系数据库 技术为基础,支持丰富的代数查询。 更多的工作则是直接以文档树形式描述不确 定性半结构化数据,例如p2 文档模型( p2document model) 、概率树模型,以及 PXML 模型 、Keulen 等人的概率树模型、PrXML 模型等。 二、 工作任务分析 我在小组中的研究部分是不确定性数据的模型。项目开启后,我的工作与任 务可分解分以下几个部分 1、学习与整理前辈们在不确定性数据方面的研究成果。这项目工作任务主要 分三个阶段进行。第一阶段是广泛地收集与了解不确定性数据的相关知识,了解 不确定性数据的轮廓,知道相关的术语、概念,方便以后与别人作相关的交流。 第二阶段是有针对性学习与理整理现有的不确定性数据模型方面的理论知识。这 一阶段,要知道各种模型的概念、所针对不同种类的数据、以及它们优势与不足 之处。第三阶段是把精力放在不确定性数据研究的某种数据的模型上。 此阶段要 做到对相关的模型在较深入的理解,不单要知道他们的定义、优劣、具体应用情 况,还要理解它们在数学上表述、证明。 2、对现有的不确定性数据模型提出自己的见解。主要包括以下一系列的活动: 1)仔细研究现在模型的优点与不足之处;2)与其它组员(还有指导老师以及相 关的研究人员)交流看法,尤其是向其它组员了解在不确定性数据的存储与查询 方面算法知识,为优化工作提供依据与灵感。3)整理所收集到的不确定性数据模 型的资料。 三、 调研报告 1 不确定性数据与xml 的发展史 实际上,针对不确定性数据的研究工作已经有几十年历史了。从二十世纪八 十年代末开始,针对概率数据库(probabilistic database)的研究工作就从未间断, 这类研究工作将不确定性引入到关系数据模型中去,取得较大研究进展。近年来, 针对不确定性数据的研究工作则在更广的范围之内取得更大的进展,即:在更丰 富的数据类型上处理更多种类的查询任务。不确定性数据管理技术的典型框架包 含四大部分:模型定义、预处理与集成、存储与索引、查询分析处理。 可扩展标记语言XML(eXtensible Markup Language)〔1〕是一种简单灵活的 文本格式的可扩展标记语言,起源于 SGML(Standard Generalized Markup Language),是 SGML 的一个子集合,也就是 SGML 的一个简化版本,非常适合 于在 Web 上或者其它多种数据源间 进行数据的交换。随着 Web 上数

文档评论(0)

raojun0013 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档