- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《Hadoop大数据原理与应用实验教程》课件全套-
Hadoop大数据原理与应用实验教程实验1准备:初识Hadoop;实验1知识地图;实验1 部署全分布模式Hadoop集群;实验1准备:初识Hadoop;资料来源:;1.1 Hadoop概述;1.1 Hadoop概述;1.2 Hadoop版本;1.3 Hadoop 2.0生态系统;1. Hadoop Common;2. HDFS;3. YARN;Hadoop MapReduce是一个分布式的、并行处理的编程模型,是针对Google MapReduce的开源实现(MapReduce: Simplified Data Processing on Large Clusters, 2004)。开发人员可以在不了解分布式系统底层设计原理和缺少并行应用开发经验的情况下,就能使用MapReduce计算框架 快速轻松地编写出分布式并行程序,完成对大规模数据集(大于1TB)的并行计算。MapReduce利用函数式编程思想,将复杂的、运行于大规模集群上的并行计算过程高度抽象为两个函数:Map和Reduce,其中Map是对可以并行处理的小数据集进行本地计算并输出中间结果,Reduce是对各个Map的输出结果进行汇总计算得到最终结果。;5. Spark;6. HBase;7. ZooKeeper;8. Hive;9. Pig;10. Impala;11. Mahout;12. Flume;13. Sqoop;14. Kafka;15. Ambari;1.4 Hadoop体系架构;1.5 部署和运行Hadoop;1. 运行环境;2. 运行模式;3. Hadoop配置文件;启动Hadoop;验证Hadoop;启动和验证Hadoop;关闭Hadoop;关闭Hadoop;【课后作业】;【参考文献】;;Hadoop大数据原理与应用实验教程实验2准备:分布式文件系统HDFS;实验2知识地图;实验2 实战HDFS;实验2准备:分布式文件系统HDFS;2.1 初识HDFS;2.2 HDFS体系架构;2.2 HDFS体系架构;2.3 HDFS文件存储原理;1. Block;2. Block副本管理策略;2. Block副本管理策略;3. 数据读取;3. 数据读取;4. 数据写入;4. 数据写入;4. 数据写入;2.4 HDFS接口;1. HDFS Web UI;1. HDFS Web UI;1. HDFS Web UI;2. HDFS Shell;1)HDFS文件系统命令;“hadoop fs”命令帮助(部分);HDFS文件系统命令说明(部分);2)HDFS系统管理命令;“hdfs dfsadmin”命令帮助(部分);3. HDFS Java API;HDFS Java API常用类;HDFS Java API;【课后作业】;【参考文献】;;Hadoop大数据原理与应用实验教程实验3准备:分布式计算框架MapReduce;实验3知识地图;实验3 MapReduce编程;实验3准备:分布式计算框架MapReduce;3.1 MapReduce编程思想;3.1 MapReduce编程思想;3.1 MapReduce编程思想;3.2 MapReduce体系架构;3.2 MapReduce体系架构;3.2 MapReduce体系架构;3.3 MapReduce作业执行流程;3.3 MapReduce作业执行流程;一个WordCount执行过程的实例;3.4 MapReduce数据类型与格式;MapReduce中常见数据类型;3.4 MapReduce数据类型与格式;3.5 MapReduce接口;1. MapReduce Web UI;1. MapReduce Web UI;2. MapReduce Shell;“mapred”帮助;2. MapReduce Shell;1)用户命令;2)管理员命令;3. MapReduce Java API;3. MapReduce Java API;3. MapReduce Java API;MapReduce Java API常用类;MapReduce Java API;3.6 其它主流分布式计算框架;1. Spark Streaming;Spark生态系统;1. Spark Streaming;2. Storm;3. Flink;【课后作业】;【参考文献】;;Hadoop大数据原理与应用实验教程实验4准备:分布式协调框架ZooKeeper;实验4知识地图;实验4 部署ZooKeeper集群和实战ZooKeeper;实验4准备:分布式协调框架ZooKeeper;4.1 初识ZooKeeper;4.2 ZooKeeper系统模型;1. ZooKeeper数据模型;ZNode类型;ZNode
您可能关注的文档
- 《Hadoop大数据原理与应用实验教程》 -课件-实验1准备:初识Hadoop.pptx
- 课件-实验3准备:分布式计算框架MapReduce.pptx
- 人工智能应用基础 课件 第1章 人工智能概述.ppt
- 人工智能应用基础 课件 第3章 图像识别与网络安全.ppt
- 人工智能应用基础 课件 第4章 自然语言处理与舆情处理.ppt
- 人工智能应用基础 课件 第5章 生物特征识别与智慧校园.ppt
- 人工智能应用基础 课件 第6章 大数据与日常生活.ppt
- 人工智能应用基础 课件 第7章 机器学习与分类.ppt
- 工业网络通信及组态技术 模拟试题及答案 A .doc
- 工业网络通信及组态技术 模拟试卷及答案 B .doc
原创力文档


文档评论(0)