分布式计算平台Hadoop环境下的组网方案.ppt

分布式计算平台Hadoop环境下的组网方案.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式计算平台Hadoop环境下的组网方案

一个有意思的现象,使用了大Buffer的交换机之后,JOB的时间会缩短,吞吐量会上去,但是仍然会看到有TCP Retransmission 这是因为心跳和TCP ACK等信令报文被积压在了Buffer中,没有及时到达,导致TCP重传 1 2 3 4 5 6 … 24 48 … 30 29 28 27 26 25 Packet Shared Buffer TCP数据报文 TCP ACK报文 Job Tracker与Task Tracker之间的心跳报文 NameNode与DataNode之间的心跳报文 为了减缓TCP Incast,高吞吐量需要Switch具备一定的Buffer,来缓存溢出的流量。但是低延迟则相反,留在Buffer中的时间越短越好。 心跳报文/TCP ACK需要低延迟,需要被快速的送达目的地。如何让这类报文避过Buffer的延迟? 使用DCTCP,减少TCP Incast带来的流量溢出。在保持高吞吐量的同时,将Buffer队列维持在一个较小的占用比例,以此让心跳报文/TCP ACK在Buffer中停留的时间大大缩短。 N3548支持DCTCP,同时具备ULL,所以会让心跳报文/TCP ACK传递的更快。 ECN首先由传输层进行能力协商 协商完毕后控制IP头的ECT、CE标致位 接收端接收到CE包,向发送端发送拥塞通知 目前TCP通过使用两个预留标志位来实现能力协商和拥塞通知 TCP新建标志位为CWR(Congestion Window Reduce)和ECE(ECN-Echo) UDP等其余传输层协议需要应用层通知 ECN:Congestion Notification SYN=1, ECE=1, CWR=1 支持拥塞通告,也支持拥塞窗口调整 SYN=1, ACK=1, ECE=1,CWR=0 支持拥塞通告,不支持拥塞窗口调整 ACK=1,ECE=0,CWR=0 能力协商结束 TCP 握手阶段 拥塞发生 IP ECT=1, CE=0 IP ECT=1, CE=0 IP ECT=1, CE=1 ACK=N, ECE=1,CWR=0 通知发生拥塞 Data, CWR=1 接收到拥塞通知,发送窗口减半 ACK=M, ECE=0, CWR=0 接收到CWR=1,ECE清除,否则持续发送 传统的ECN模式 Data Center TCP Algorithm Switch side: Mark packets when Queue Length > K. Queue is not full Sender side: Maintain running average of fraction of packets marked (α). In each RTT: Adaptive window decreases: Note: decrease factor between 1 and 2. B K Mark Don’t Mark Source: Data Center TCP (DCTCP), SIGCOMM 2010, New Dehli, India, August 31, 2010. Incast Results with DCTCP 2MB 4MB 8MB 每台服务器使用翻倍的以太网链路接入交换矩阵,消除TCP Incast。以空间换时间。 简单粗暴:增加Server与网络之间的带宽 MapReduce的运行方式会造成TCP Incast,降低Hadoop的运算效率。 网络架构设计灵感来自于CRS ,设计要点包括: 加速比/Speedup、ECMP 、 Self Routing、Buffer 解决TCP Incast的方式: 大Buffer 适量的Buffer + DCTCP(N3548) 使用翻倍的以太网链路接入交换矩阵,消除TCP Incast * * * * * * /~ychen2/professional/TCPIncastWREN2009.pdf * * * Transcript: Let's see, we have two linecards trying to send 10G to an input linecard but thanks to the virtual output queues that are using Cisco 12000 or ASR 9000 it just works correctly. There is no blocking for this traffic because the arbiter will correctly grant the capacity and any other tra

文档评论(0)

peain + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档