- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
云计算CLOUD COMPUTING Third Edition(第三版)第 2 章Google云计算原理与应用(三)序言 下载提示:该课件是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。课件下载后可定制修改,请根据实际需要进行调整和使用,谢谢! Download reminder: This courseware is carefully compiled by this shop. I hope that after you download it, it can help you solve practical problems. The courseware can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!目录 2.1 Google文件系统GFS2.2 分布式数据处理MapReduce2.3 分布式锁服务Chubby2.4 分布式结构化数据表Bigtable2.5 分布式存储系统Megastore2.6 大规模分布式系统的监控基础架构Dapper2.7 海量数据的交互式分析工具Dremel2.8 内存大数据分析系统PowerDrill2.9 Google应用程序引擎2.5 分布式存储系统Megastore2.5.1 设计目标及方案选择2.5.2 Megastore数据模型2.5.3 Megastore中的事务及并发控制2.5.4 Megastore基本架构2.5.5 核心技术——复制2.5.6 产品性能及控制措施2.5 分布式存储系统Megastore设计目标及方案选择 设计目标设计一种介于传统的关系型数据库和NoSQL之间的存储技术,尽可能达到高可用性和高可扩展性的统一。方法一方法二针对可用性的要求,实现了一个同步的、容错的、适合远距离传输的复制机制。针对可扩展性的要求,将整个大的数据分割成很多小的数据分区,每个数据分区连同它自身的日志存放在NoSQL数据库中,具体来说就是存放在Bigtable中。2.5 分布式存储系统Megastore数据的分区和复制在Megastore中,这些小的数据分区被称为实体组集(Entity Groups)。每个实体组集包含若干的实体组(Entity Group,相当于分区中表的概念)。一个实体组中包含很多的实体(Entity,相当于表中记录的概念)。2.5 分布式存储系统Megastore2.5.1 设计目标及方案选择2.5.2 Megastore数据模型2.5.3 Megastore中的事务及并发控制2.5.4 Megastore基本架构2.5.5 核心技术——复制2.5.6 产品性能及控制措施2.5 分布式存储系统Megastore传统的关系型数据库不合适的三个原因传统的关系型数据库是通过连接(Join)来满足用户的需求的,但是就Megastore而言,这种数据模型是不合适的,主要有以下三个原因:原因 1对于高负载的交互式应用来说,可预期的性能提升要比使用一种代价高昂的查询语言所带来的好处多原因 2Megastore所面对的应用是读远多于写,因此好的选择是将读操作所需要做的工作尽可能地转移到写操作上原因 3在Bigtable这样的键/值存储系统中存储和查询级联数据(Hierarchical Data)是很方便的 Megastore数据模型怎么设计?2.5 分布式存储系统Megastore细粒度控制的数据模型和模式语言同关系型数据库一样,Megastore的数据模型是在模式(schema)中定义的且是强类型的(strongly typed)Google团队设计的Megastore数据模型每个模式都由一系列的表(tables)构成,表又包含有一系列的实体(entities),每实体中包含一系列属性(properties)属性是命名的且具有类型,这些类型包括字符型(strings)、数字类型(numbers)或者Google的Protocol Buffers。2.5 分布式存储系统Megastore照片共享服务数据模型实例 表Photo就是一个子表,因为它声明了一个外键User则是一个根表一个Megastore实例中可以有若干个不同的根表,表示不同类型的实体组集 三种不同属性设置,既有必须的(如user_id),也有可选的(如thumbnail_url)Photo中的可重复类型的tag属性2.5 分布式存储系统MegastoreMegastore索引定义在单个实体组中,作用域仅限于单个实体组( 如PhotosByTime )局部索引主要两类全局索引可以横跨多个实体组集进行
文档评论(0)