《分布式存储和计算系统》.pptVIP

  • 16
  • 0
  • 约9.21千字
  • 约 61页
  • 2015-12-10 发布于河南
  • 举报
《分布式存储和计算系统》.ppt

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 读文件流程 HDFS关键运行机制 客户端联系NameNode,得到所有数据块信息,以及数据块对应的所有数据服务器的位置信息。 尝试从某个数据块对应的一组数据服务器中选出一个,进行连接(选取算法未加入相对位置的考虑)。 数据被一个包一个包发送回客户端,等到整个数据块的数据都被读取完了,就会断开此链接,尝试连接下一个数据块对应的数据服务器,整个流程,依次如此反复,直到所有想读的都读取完了为止。 技术架构 Hadoop VS.Google 数据结构化管理组件:Hbase→BigTable。 并行计算模型:MapReduce→MapReduce。 分布式文件系统:HDFS→GFS。 Hadoop缺少分布式锁服务Chubby。 HBase MapReduce HDFS BigTable MapReduce GFS Hadoop云计算应用 Chubby Google云计算应用 HDFS与GFS比较 Hadoop VS.Google 中心服务器模式的差异。 GFS:多台物理服务器,选择一台对外服务,损坏时可选择另外一台提供服务。 HDFS:单一中心服务器模式,存在单点故障。 原因:Hadoop缺少分布式锁服务。 安全模式的差异。 HDFS具备安全模式。获

文档评论(0)

1亿VIP精品文档

相关文档