大连理工大学算法分析与相关设计2014 3章_分布式数据库系统的设计2014-12-3.ppt

大连理工大学算法分析与相关设计2014 3章_分布式数据库系统的设计2014-12-3.ppt

  1. 1、本文档共114页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大连理工大学算法分析与相关设计2014 3章_分布式数据库系统的设计2014-12-3.ppt

*;*;*;*;*;*;*;*;1.2 分布式数据库的发展;*;*;*;一、集中式数据库设计 包括四个阶段:需求分析、概念设计、逻辑设计、物理设计。 需求分析涉及收集用户数据库应用的非结构规格说明,并收集在 设计数据字典中。 概念设计产生全局、综合数据库模式的一种概念规格说明和在此 模式上执行应用的概念规格说明。 逻辑设计将综合概念模式转换成一给定的DBMS类型(关系、网状、 层次或面向对象模型)的数据库模式。 物理设计要遵照所选择的特定DBMS的能力和特征进行,并产生 实现数据库的物理访问结构的定义。;*;把现有数据库集成起来构成分布式数据库时,可采用自底向上的方法。此方法重点是把将现有的各种不同的数据库模式集成为全局模式。 集成就是把公用数据定义合并起来,并解决对同一个数据的不同表示 方法之间的冲突。 把现有数据库集成为一分布式数据库时,现有数据库很可能使用的是 不同的DBMS,这将构成异构系统,从而增加了数据集成的复杂性。 此时可以在每对不同的DBMS之间进行一对一的翻译,也可选择一个 公用数据模型,然后再把涉及这个DBMS的所有的不同模式都翻译成 这种唯一的表示方法。 ;自底向上设计方法主要问题是构造一个全局模式(超视图). 把分布式数据库中各站点上的数据库模式看成是全局模式的一个 视图,则寻求全局模式的问题可以看作是视图综合问题。 概括分层结构支持视图综合。概括分层允许定义两个实体之间的 类型和子类型关联,用于两个视图对同一实体的部分属性相交时。 视图综合问题的经典方法就是生成三个实体: 一个实体具有共同属性(超类型),两个实体具有不相交属性(子类型)。在全局视图中,共同属性与子类型相关联,并且对包含非相交 属性的各个视图生成一子类型。 视图综合次序问题:一次把一个视图和全局模式进行综合,逐步构造起全局视图。通常最好首先综合最大的或最重要的视图,然后综合小的或者不重要的视图。;班 机;识别相似性: 综合两个模式的第一步是识别它们的相似性,识别相似性是综合 模式的出发点。 从先前存在的数据库中数据的相似性可以推得匹配,相似的值集 表明相交。 通过比较属性,可以识别匹配属性域。 如果在不同站点上有相似应用,使用各自数据库中的数据副本, 则这两站点的数据库之间有某些相似点。 ;识别冲突:识别不同模式中相似数据的不同表示或域定义。 通过在全局模式中引入差异或在源模型中做一些折中,可以解决冲突。 模式差异包括命名冲突、域差异、定标差异和结构差异。 命名冲突:同物异名(EMP,EMPLOYEE)和异物同名。通过在 全局模式中存储名字对应表就能方便地解决。 域差异:检测此问题通过比较源数据库或文件并注意不一致性来 进行。概括分层可以用来表示这一问题的解。 定标差异:在具有同一数值的不同视图中可以见到定标差异,如 计量单位不同(天、小时、分钟、秒)。设计中如有可能,应使用 更精确的定标来检索数据,并使用换算公式进行连接或输出。 结构差异:同一对象有的用实体描述, 有的用属性描述。视图设计中,一般通过改变一个或两个视图来解决结构差异。;处理操作期间的不一致数据策略(5种) 对于设计时不能解决的冲突,需设计可供选择的策略,当执行时检测到不一致性时,以回答有不一致数据的查询。这些策略包括: 显示任一不一致值,但不通知用户。这是最直截了当,同时也是最 危险的解决办法。 显示所有不一致值,并告诉用户不一致值信息源。在这种情况下, 用户应能评价不一致性的原因。 求不一致值的某些组合函数值,并向用户显示此结果。可能使用的 组合函数包括求平均、求最小值、求最大值。使用这种技术是在不 同时间内出现时预期观察值也不同的场合。 显示最新值。这一策略需要更新操作的时间戳。它所依据的假设是 不一致性归因于更新不及时,因此,最新的值也是最可能的值。 显示最可靠系统的值。这一策略所依据的假设是,设计者可以评价 分布式数据库中站点的可靠性。;分片设计的基本目的:产生一个对全局数据合适的划分方案。使用这种方案得到的片段作为分布式数据库中数据的分配和存储单位时,不但能够减少应用中的操作量,而且能够对于应用具有最大可能的本地性,使绝大多数应用所使用的数据位于该应用的原发站点。;有两种基本的数据分片方法:水平分片方法和垂直分片方法。 水平分片是对全局关系执行“选择”操作,把具有相同性质的元组 进行分组,构成若干个不相交的子集。 水平分片的方法可归为基本水平分片和导出水平分片两类。 垂直分片是通过“投影”操作把它的属性分成若干组。根据应用以“同样方式”(具有

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档