- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IDH的中高端网络配置推荐 如果整个集群的负载比较高,或者非常高,这就需要更换性能更好的网络 在较高负载的情况下,可以考虑使用性能更好10GBE以太网络 每一个网络端口的成本会是原来的3倍,但有约10倍的性能提升 一些Hadoop模块,例如HBase能够从低延迟中获得利益,能够提高总体的性能 如果需要的通信量更大,或者需要混合一些高性能计算程序,整个IDH需要更加高端的网络配置 推荐使用InfiniBand网络,InifiBand网络具有更好的实现机制,能够减少网络的冲突 InfiniBand的带宽有10G,20G以及40G的选择,并延迟更短 小规模硬件推荐 4~10个节点,解决较小规模问题 项目 指标 处理器CPU 双路四核服务器处理器,2x4 2.6GHz 内存 32G或者以上内存,DDR3,ECC 磁盘接口 SAS 6GB/s 磁盘 6x或者12x SATA 1T 7200RPM监控级硬盘 网络 两个以太网口 中规模硬件推荐 20+个节点,解决中等规模问题,实际上能够满足大多数中小企业的需求 项目 指标 处理器CPU 双路六核服务器处理器,处理器缓存15MB,2x6 2.9GHz 内存 64G或者以上内存,DDR3,ECC 磁盘接口 SAS 6GB/s 磁盘 6x或者12x SATA 1T或者3T 7200RPM监控级硬盘(依据数据规模而定) 网络 两个以太网口 高端硬件推荐 依据问题规模确定所需要的节点数目,解决大规模问题,使用高端的内存,高速网络 项目 指标 处理器CPU 双路六核服务器处理器,处理器缓存15MB,2x6 2.9GHz,依据应用可以选用更高端的处理器 内存 96G或者以上内存,DDR3,ECC 磁盘接口 2xSAS 6GB/s 磁盘 24x 1TB 告诉SAS硬盘 网络 10Gb以太网口 高端网络可以考虑使用InifinBand网络 Hadoop运行的软件环境 操作系统 Hadoop是在Linux环境下开发的,自然运行的环境也为Linux环境。任何一个支持Java1.6的Linux环境都可以运行Hadoop。为了性能以及配置上的方便,IDH环境使用了RedHat公司的RedHat Linux环境,与之匹配的环境包括CentOS以及Oracle Linux Java运行环境 Hadoop的运行需要一个高于Java1.5.x(5.0.x)的版本的Java运行环境,推荐使用Java1.6.x的运行环境。建议使用Oracle Sun的标准的Java环境,这是一个通过测试的环境 SSH SSH工具能够用来启动远程的命令,Hadoop是一个集群的环境,通过SSH工具能够在一个中心的管理节点上远程启动集群中的其它节点的服务进程 IDH集群的规划,运行角色在节点上的分配 在IDH规划中,除了选取硬件之外,还需要进行角色的规划 角色的规划即确定IDH的某一个运行角色运行在哪个节点之上 与硬件推荐情况一致,首先需要确定IDH集群的本身负载,针对小规模,中规模以及大规模集群有不同的集群规划方案 IDH Hadoop集群典型的节点分配 角色 描述 节点数目 HDFS NameNode 分布式文件系统用以存储文件系统以及数据块的元数据 1个独立节点 HDFS Secondary NameNode NameNode的影子节点 小规模集群可以和NameNode共享节点,大规模集群用独立节点 HDFS DataNode HDFS数据存储 多个独立节点 MapReduce JobTracker MapReduce调度程序 1个独立节点,小规模集群可以与NameNode共享,大规模集群使用独立节点 MapReduce TaskTracker MapReduce实际计算节点 与DataNode运行在相同的节点之上 Hive Hive元数据以及驱动程序 独立配置的话可以与NameNode共享节点,或者将元数据存放在客户端 IDH Hadoop集群典型的节点分配 角色 描述 节点数目 ZooKeeper 用以提供集群高可用性的锁服务 3个或3个以上的奇数的独立节点(小规模可以和其它角色共享节点) HBase HMaster HBase用以调度RegionServer的主模块 与其它角色共享节点的多个节点 HBase RegionServer HBase中用以管理数据的模块 一般与DataNode运行与相同的节点之上 Management Node IDH特有的管理节点 一般为一个独立的节点,如果小规模集群的话可以与其它角色共享 小规模测试集群的规划 小规模测试集群不需要高可用性,无需NameNode的高可用性,将所有的头结点都配置到单个的节点中。配置方案: 头结点Head Node:NN+2NN+JT+ZK+HMaster+IntelMa
您可能关注的文档
最近下载
- 2025湖北武汉市汉阳区招聘社区干事40人备考试题及答案解析.docx VIP
- 新能源汽车试题库(附答案).docx VIP
- 《碳纤维片材加固混凝土结构技术规程》(2022年版).pdf VIP
- 2023年地面及屋面分布式光伏发电工程HSE作业指导书(最终版).docx VIP
- 常用塑料特性及塑料成型工艺.pdf VIP
- 甲烷安全技术说明书MSDS.pdf VIP
- 统编版语文四年级上册第五单元素养评估(含答案).docx VIP
- 入党志愿书电子版模板(空白) .doc VIP
- 五年级下册生字练字帖硬笔书法.pdf VIP
- 《国有企业管理人员处分条例》考试题库200题(含答案).docx VIP
文档评论(0)