- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 简介: 江西电信Hadoop批处理平 台共由62台PC服务器构成, 形成物理上独立的3个RACK ,按照功能角色分组,主控 节点、数据节点、Hive接入 节点、元数据节点、监控告 警节点和ETL节点。 主控节点6台 (2台Namenode、1台 Jobtracker、3台 Zookeeper) 数据节点56台 江西电信物理部署的Hadoop集群 。 12 企业信息化部 。 把信息化打造成为中国电信企业核心竞争力之一 第二篇HDFS 一: HDFS简介 二: HDFS 架构 三: 漫画HDFS之读写机制 四: 漫画HDFS之容错性 五: 漫画HDFS之复制策略 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 1 HDFS简介 HDFS(HADOOP DISTRIBUTED FILE SYSTEM),是一个分布式文件系统。它 是谷歌的GFS提出之后出现的一种用户级文件系统。有一定的容错性, 能提供高吞吐量的数据访问,适合大规模数据集上的应用。 HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 2 HDFS 架构 Block:大文件的存储会被分割为多个block进行存储。默认64MB,每一个 blok会在多个datanode上存储多份副本,默认3份 基 本 概 念 Namenode:主要负责存储一些metadata信息,主要包括文件目录、block 和文件对应关系,以及block和datanote的对应关系 Datanode:负责存储数据,数据以block的形式存在 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 3 HDFS 之漫画读写 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 3 HDFS 之漫画读写(续) 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 3 HDFS 之漫画读写 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 3 HDFS 之漫画读写 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 4 HDFS 之漫画容错 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 4 HDFS 之漫画容错 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 4 HDFS 之漫画容错 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 4 HDFS 之漫画容错 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 5 HDFS 之漫画复制策略 。 24 企业信息化部 。 把信息化打造成为中国电信企业核心竞争力之一 第二篇 MapReduce 一:MapReduce基础 二:MapReduce优劣 三:MapReduce工作原理 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 1 MapReduce基础 MapReduce是一种编程模型,用于大规模数据集的并行计算。核心操作 由Map(映射)和Reduce(归约)组成,极大地方便了编程人员在不会分 布式并行编程的情况下,将自己的程序运行在分布式系统上 典型的MapReduce过程可以细分为Input(Split)、Mappers、(Shuffle/Partition/Sort)、 Reducers和Output等阶段 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 1 MapReduce示例 1.输入端根据输入文本大小进行切片形成适合Map处理的数据片 2.分片后的数据申请Map资源,执行本地单词映射操作 3.通过交换将map生成的结果按照单词进行归并重组 4.重组后的结果,申请Reduce资源,进行单词的合并统计 5.对Reduce的结果进行记录合并生成输出文件 MapReduce 过程示例 ? 对输入的文 本进行单词 统计 ? 对输入的文 本进行单词 统计 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 2 MapReduce 执行过程 从MapReduce在整个Hadoop框架 的位置可以看出作为Hadoop最成熟 的批处理框架,MapReduce起到承 上启下的作用,一方面可以操作 HDFS中的数据,另一方面可以被封 装,提供Hive、Pig这样的上层组件 的调用 。 企业信息化部 把信息化打造成为中国电信企业核心竞争力之一 MapReduce优劣 MapReduce的缺点 ? 通过MapReduce这个分布式处理框架,不仅能用于处理大规模数据, 而且能将很多繁琐的细节隐藏起来,比如,自动并行化、负载均衡和 灾备管理等,这样将极大地简化开发者工作 ? MapReduce的伸缩性
您可能关注的文档
最近下载
- 隧道帷幕注浆监理实施细则(王开发2016.04).doc VIP
- 基层医疗卫生机构常见新生儿疾病诊疗专家共识:新生儿低血糖症(2025年).pptx VIP
- 彩板安装施工方案.doc VIP
- 彩板安装施工方案.pdf VIP
- 彩板安装专项施工方案.docx VIP
- “皖江名校联盟”2025-2026学年高三12月质量检测语文试卷(含答案详解).docx
- 示范性院校重点建设专业(群)计算机应用技术专业及专业群建设项目建设方案.doc VIP
- 20192020部编版九年级语文上册期末必考古诗词默写.docx
- 智茂GAM330 GAM320编程基本操作.ppt VIP
- 钢结构金属屋面板反吊板安装施工挂篮.pdf VIP
原创力文档


文档评论(0)