解析Google数据中心架构设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
解析 Google 数据中心架构设计 Experience with a Globally-Deployed Software Defined WAN 1 目录 1. 流量的巨大浪费3 2. Why SDN?4 3. Design5 3.1. Overview 5 3.2. Switch Design 6 3.3. Routing 7 4. TE 算法9 4.1. 优化目标9 4.2. 选路10 4.3. 分配流量12 4.4. 流量离散化12 4.5. 离散化会降低性能吗13 5. TE 实现14 5.1. Tunneling 14 5.2. TE as Overlay 15 5.3. 操作依赖17 6. 部署效果18 6.1. 统计18 6.2. 错误恢复18 6.3. 优化效果19 6.4. 一次事故20 7. 结语22 2 导读:Google 首次将其数据中心广域网 (WAN) 的设计和三年部署经验完整地公之于 众。为什么 Google 要用 Software Defined Networking (SDN)?如何把 SDN 渐进地 部署到现有的数据中心?透过论文,我们能窥见 Google 全球数据中心网络的冰山一角。 1. 流量的巨大浪费 众所周知,网络流量总有高峰和低谷,高峰流量可达平均流量的 2~3 倍。为了保证高峰 期的带宽需求,只好预先购买大量的带宽和价格高昂的高端路由设备,而平均用量只有 30%~40%。这大大提高了数据中心的成本。 这种浪费是必然的吗?Google 观察到,数据中心中的流量是有不同优先级的: • 用户数据拷贝 到远程数据中心,以保证数据可用性和持久性。这个数据量最小,对延 迟最敏感,优先级最高。 • 远程存储访问 进行 MapReduce 之类的分布式计算。 3 • 大规模数据同步 以同步多个数据中心之间的状态。这个流量最大,对延迟不敏感,优 先级最低。 Google 发现高优先级流量仅占总流量的 10%~15%。只要能区分出高优先级和低优先级 流量,保证高优先级流量以低延迟到达,让低优先级流量把空余流量挤满,数据中心的广 域网连接(WAN link)就能达到接近 100% 的利用率。要做到这个,需要几方面的配 合: • 应用(Application)需要提前预估所需要的带宽。由于数据中心是 Google 自家的, 各种服务所需的带宽都可以预估出来。 • 低优先级应用需要容忍高延迟和丢包,并根据可用带宽自适应发送速度。 • 需要一个中心控制系统来分配带宽。这是本文讨论的重点。 2. Why SDN? 计算机网络刚兴起时,都是插一根线连到交换机上,手工配置路由规则。在学校机房之类 网络不复杂的情况下,时至如今也是这么做的。但是,只要增加一个新设备,就得钻进机 房折腾半天;如果一个旧设备坏了,就会出现大面积的网络瘫痪。广域网络的维护者们很 快就不能忍受了,于是就诞生了分布式、自组织的路由协议 BGP、ISIS、OSPF 等。 为什么设计成这样呢?有两方面原因。首先,七八十年代广域网络刚刚兴起时,网络交换 设备很不稳定,三天两头挂掉,如果是个中心服务器分配资源,那么整个网络就会三天两 头瘫痪。其次,Internet 是多家参与的,是 Stanford 愿意听 MIT 指挥,还是 MIT 愿 意听 Stanford 指挥? 4

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档