- 2
- 0
- 约1.67千字
- 约 53页
- 2018-06-21 发布于上海
- 举报
云计算第二版教材配套课件4—第二章 googl
《云计算(第二版)》购买网址:
当当网 京东商城;提 纲;分布式存储系统Megastore ;;设计目标及方案选择 ;数据分区和复制 ;分布式存储系统Megastore ;Megastore数据模型 ;?Google设计了一种能够提供细粒度控制的数据模型和模式语言
?同关系型数据库一样,Megastore的数据模型是在模式(schema)中定义的且是强类型的(strongly typed)
?每个模式都由一系列的表(tables)构成,表又包含有一系列的实体(entities),每实体中包含一系列属性(properties)
?属性是命名的且具有类型,这些类型包括字符型(strings)、数字类型(numbers)或者Google的Protocol Buffers。这些属性可以被设置成必须的(required)、可选的(optional)或者可重复的(repeated,即允许单个属性上有多个值) ;数据模型实例 ;索引(Index) ;Bigtable中数据存储情况 ;分布式存储系统Megastore ;Megastore中的事务及并发控制;Megastore中的事务及并发控制;读:获取最后一次提交的事务的时间戳和日志位置 ;Megastore中的事务机制 ;分布式存储系统Megastore ;Megastore的基本架构;?Megastore中提供快速读(Fast Reads)和快速写(Fast Writes)机制
?快速读
?如果读操作不需要副本之间进行通信即可完成,那么读取的效率必然相对较高
?利用本地读取(Local Reads)实现快速读,能够带来更好的用户体验及更低的延迟
?确保快速读成功的关键是保证选择的副本上数据是最新的。为了达到这一目标,引入了协调者的概念
?协调者是一个服务,该服务分布在每个副本的数据中心里面。它的主要作用就是跟踪一个实体组集合
?协调者的状态是由写算法来保证
;?快速写
? Megastore采用了一种在主/从式系统中常用的优化方法。如果一次写成功,那么下一次写的时候就跳过准备过程,直接进入接受阶段
?Megastore没有使用专门的主服务器,而是使用leaders
?leader主要是来裁决哪个写入的值可以获取0号提议
?优化:提交值最多的位置附近选择一副本作为leader
?客户端、网络及Bigtable的故障都会导致一个写操作处于不确定的状态
;分布式存储系统Megastore ;复制的日志 ;数据读取 ;数据写入 ;协调者的可用性 ;分布式存储系统Megastore ;可用性分布情况 ;产品延迟情况分布 ;大规模分布式系统的监控基础架构Dapper ;用户将一个关键字通过Google的输入框传到Google的后台,在我们看来很简单的一次搜索实际上涉及了众多Google后台子系统,这些子系统的运行状态都需要进行监控 ;;设计目标 ;大规模分布式系统的监控基础架构Dapper ;基本概念 ;基本概念 ;区间Helper.Call的详细信息 ; 监控信息的汇总 ;?监控数据汇总是单独进行的,而不是伴随系统对用户的应答一起返回的,如此选择主要原因:
?内置的汇总方案(监控数据随RPC应答头返回)会影响网络动态
?内置的汇总方案需要保证所有的RPC都是完全嵌套
?安全问题
?应用层注释提供一种方便的选择机制(Opt-in Mechanism):应用程序开发者可以将任何对后期分析有益的数据和区间关联起来 ;大规模分布式系统的监控基础架构Dapper ;Dapper三个设计目标中,实现难度最大的是 ?;轻量级核心功能库 ;二次抽样技术 ;大规模分布式系统的监控基础架构Dapper ;Dapper存储API ;Dapper用户界面 ;Dapper用户界面 ;Dapper用户界面 ;大规模分布式系统的监控基础架构Dapper ;;;;谢 谢!
原创力文档

文档评论(0)