- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 分布式文件及数据库系统
Java项目在设计模式和文档上一般都比C++项目好,非常适合开源项目。C++的优势是在性能和内存使用上。 Hbase和Hypertable提供了类似于BigTable的可伸缩数据库实现。 3.8分布式数据库系统类型 HBase和Hypertable是两个开源项目,Google的BigTable不开源。 它们主要解决的都是数据的组织和存储策略问题。 3.8分布式数据库系统类型 3.8.1 Hbase(分布式数据库) Hbase 是Hadoop的一个子项目,?Hbase采用了Google BigTable的稀疏的,面向列的数据库实现方式的理论,建立在hadoop的hdfs上 ?.是一个稀疏的,长期存储的{存在硬盘上},多维度的,排序的映射表。 3.8.1 Hbase(分布式数据库) 3.8.2 BigTable bigtable是设计来分布存储大规模结构化数据的,从设计上它可以扩展到上2^50字节,分布存储在几千个普通服务器上。Google的很多项目使用BT来存储数据,包括网页查询,google earth和google金融。这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星图象)不同,反应速度不同(从后端的大批处理到实时数据服务)。对于不同的要求,BT都成功的提供了灵活高效的服务。 BT是一个稀疏的,长期存储的{存在硬盘上},多维度的,排序的映射表.这张表的索引是行关键字,列关键字和时间戳.每个值是一个不解释的字符数组。 3.8.2 BigTable (1)DDB具有数据分布性和逻辑整体性的特点。 (2) DDBS能够支持涉及多个场地的全局应用。 DDB的数据存储有数据分片和数据分配两种策略。 (3) DDB的模式结构为理解DDBS提供了一种 通用的概念结构。 (4)分布透明性是DDBS追求的目标。 (5) DDBMS是负责管理分布环境下,逻辑集成数据的存取、一致性、有效性和完备性的软件系统。 总结: DDBS中数据分布在各个场地,系统中压倒一切的性能目标是尽量减少网络中传送信息的次数和传送的数据量。分布式查询中基于半连接的优化策略是常用的技术。 对于并发控制和恢复,DDBMS环境中会出现大量在集中式DBMS环境中碰不到的问题。分布式的并发控制有主场地方法和主拷贝方法,再辅之于备份场地技术。 总结: 分布式DBMS 集中式DBMS ①存取方式 用户→DDBMS→分布式网络OS→网络通信→局部DBMS→局部OS→DB 用户→DBMS→OS→DB ②数据冗余性 有控制的冗余 最小的冗余 ③数据表示级别 (四级)用户试图,全局视图,分片视图,分配视图 (三级)外部视图,概念视图,内部视图 ④数据存放方式 复制在多个场地,模式分散化,处理程序也分散化 集中在一个地点 ⑤DBA 分布在各场地, 进行局部控制 集中在一起 ⑥同步 由全局DBMS和 网络OS组成 由OS完成 ⑦封锁 分散控制 集中控制 ⑧实际资源 多个CPU,多个DBMS 一个CPU,一个DBMS ⑨操作方式 当前方式,响应方式两种 一种方式(当前方式) ⑩数据一致性 所有主场地的逻辑结果是一致的,但各个场地的复制中数据可能不一致 任何时候都需要保持 数据的一致性 总结: * 3.4 分布式数据库 3.4.1 分布式数据库系统概述 集中式数据库管理系统的缺点:通信开销大;系统的坚固性差;性能差;可扩充性差;设计、管理困难。 分散式系统:将数据库分成多个,建立在多台计算机上,数据库的管理、应用程序的研制都是分开并相互独立的,之间不存在数据通行联系。 分布式数据库系统的特点:数据的分布性;统一性;透明性。统一性(两个方面:数据在逻辑上的统一性和数据在管理上的统一性) 分布式数据库与集中式数据库相比的优点:坚固性好;可扩充性好;可改善性能;自治性好。 3.3.1 分布式数据库系统概述 与集中式数据库相比,分布式DB具有:数据分布式的特点。 与分散式数据库相比,分布式DB具有:逻辑整体性的特点。 背景 数据库系统+计算机网络 DB1 DB1 DB1 计算机1 计算机2 计算机3 通讯网络 T1 T2 T3 T1 T2 T3 T1 T2 T3 3.3.1 分布式数据库系统概述 分布式数据库系统(DDBS)由通信网络联接起来的结点的集合。每个结点都是拥有集中式数据库的计算机系统。 分布式数据库的特点:数据库中的数据不是存储在同一场地,而是分布存储在多个场地。 3.3.2 分布式数据库系统的定义 分布性:数据存储在不同场地上。与集中式数据库不同。 逻辑整体性:数据逻辑上是相互联系的一个整体。与分散在计算机网络不同站点上的一组没有相互联系的本地数据库区别开来。
您可能关注的文档
最近下载
- GB+16423-2020金属非金属矿山安全规程.docx VIP
- 2024《拔高训练之50类题型精练》九年级物理全一册.pdf
- 罗道病课件文档.ppt VIP
- T∕CACM 1021.89-2018 中药材商品规格等级 鸡内金.docx VIP
- 人教版(2024)九年级全一册物理全册教案.docx
- T/BGEA001-2019 预拌流态固化土填筑工程技术标准.pdf VIP
- (2025秋新版)二年级语文上册全册教案.pdf
- 涉诈风险账户审查表.doc VIP
- CATIA自由曲面教程教程分析.doc
- 2025云南昆明巫家坝建设发展有限责任公司及下属公司第三季度招聘23人笔试历年参考题库附带答案详解.docx
文档评论(0)