- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 大数据技术概Hadoop平台的安装与配置;2.1 安装准备;实验用的Hadoop硬件规格要低得多。笔者建议使用VMware的虚拟主机来搭建Hadoop的实验环境,用以下规格的笔记本电脑或台式主机即可满足实验需要。
(1) 处理器:1颗4核的Intel Core i7(或更高)的CPU;
(2) 内存:8GB(或更高)的DDR 3内存;
(3) 硬盘:1个120GB(或更大)的SSD硬盘和1个500GB(或更大)SATA硬盘;
(4) 网卡:千兆的以太网适配器。
;1. 创建Linux虚拟主机
2. 安装Ubuntu操作系统;1. 下载JDK 1.8
2.解压并安装JDK
3. 添加JDK的环境变量
4. 配置默认JDK版本
5. 测试JDK
;2.2 Hadoop的集群安装;2. Pseudo-Distributed Mode(即伪分布模式):在该模式下,Hadoop的守护进程运行在本地机器上。该模式模拟一个分布式集群,数据存储于分布式文件系统HDFS,而不保存于Linux的本地文件系统。同时,通过创建不同的JVM实例来实现程序的分布式运行。???种模式主要是考虑用户没有足够的机器去部署一台完全分布式的环境。
3. Fully-Distributed Mode(即完全分布模式):在该模式下,Hadoop在集群中的每个节点上启动一个守护进程,系统依靠HDFS实现数据的分布式存储,MapReduce程序中的Map任务和Reduce任务通过调度机制并发地运行于不同的节点之中,实现数据的就近处理。
;【注意】Hadoop并不严格区分伪分布模式和完全分布模式。在Hadoop环境中,所有服务器节点仅划分为两种不同角色:master(主节点,1个)和slaves(从节点,多个)。因此,伪分布模式是完全分布模式的特例,只是将主节点和从节点合二为一罢了。
;2.2.1 Hadoop的运行模式;
详细配置过程见教材第2.2.2小节。
1. 网络配置
2. 修改主机名
3. 修改主机IP解析表
4. 配置时钟同步服务
5. 关闭防火墙
;
详细配置过程见教材第2.2.3小节。
1. 安装SSH服务
2. 检查SSH服务是否启动
3. 生成RSA密钥(包括私钥和公钥)
4. 将公钥文件复制为Hadoop能识别的免密码登录的授权文件。
5. 将主节点上的包含公钥的授权文件复制到各从节点
6. 验证SSH
;详细配置过程见教材第2.2.4小节。
1. 下载Hadoop2.7.2?
2. 解压安装
3. 为运行Hadoop创建目录
4. 设置环境变量
;详细配置过程见教材第2.2.5小节。
1. 配??Hadoop守护进程的运行环境
2. 配置Hadoop守护进程的运行参数
3. 设置从节点
4. 配置Hadoop的日志
;详细配置过程见教材第2.2.6小节。
1.传送Hadoop到各从节点
2. 格式化文件系统
3. 启动Hadoop集群
4. 查看master工作状况
5. 查看slave工作状况
6. 用Web UI查看Hadoop集群的工作状态
7. 关闭Hadoop集群
;2.3 Hadoop开发平台的安装;详细安装过程见教材2.3小节。
1.Eclipse的安装
2.下载hadoop-eclipse-plugin插件
3.在Eclipse中配置Hadoop
您可能关注的文档
- 大豆种子的形态结构.ppt
- 大豆种子加工工艺流程图.ppt
- 大气污染第二章.ppt
- 大气污染第六章.ppt
- 大气污染第七章.ppt
- 大气污染第三章.ppt
- 大气污染第四章.ppt
- 大气污染第五章.ppt
- 大气污染第一章.ppt
- 大数据技术基础第八章:Spark概述.pptx
- 上海市宝山区2025-2026学年第一学期期末考试高三英语试卷(含答案).pdf
- 云南省普洱市镇沅县第一中学2025-2026学年高二上学期期中考试语文试题(含答案).pdf
- 天津市扶轮中学2025-2026学年高一上学期第一次月考英语试题(含答案).pdf
- 上海市杨浦区2026届高三一模英语试题(含答案).pdf
- 湖北省八校联考2025-2026学年高二上学期月考语文试题(含答案).pdf
- 山西省介休市第一中学校2025-2026学年高二上学期期中考试英语试卷(含答案,无听力原文及音频).pdf
- 江苏省无锡市梅村高级中学2025-2026学年高二上学期期中英语试题(含答案).pdf
- 山东省临沂市临沭县2025-2026学年九年级(上)期中化学试卷(含答案).pdf
- 山东省菏泽市2025-2026学年高二上学期期中考试英语(B)试卷(含答案,无听力原文及音频).pdf
- IPO审核耗时与首发股票市场表现.pdf
最近下载
- 第2章化学药物工艺路线的设计和选择研究报告.ppt
- 610821017856A03BG100河西联办煤矿隐蔽致灾因素普查报告修编7.19 (2)(1).docx VIP
- InSAR滑坡识别与监测.pptx VIP
- 政治经济学课件-社会主义市场经济体制.ppt VIP
- Unit 6 Useful numbers Part A(课件)人教PEP版(2024)英语三年级上册.pptx VIP
- 美卡素治疗高血压.ppt VIP
- 医院数据沙箱管理控制 .ppt VIP
- 青岛版科学六年级上册期末综合测试卷(含答案).pdf VIP
- 12YD18 太阳能光伏发电系统设计与安装.docx VIP
- 三维细胞培养技术的发展及其在干细胞和肿瘤细胞.PDF VIP
原创力文档


文档评论(0)