Hadoop简介说课一等奖.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Hadoop简介1、了解hadoop2、了解MapReduce目录Hadoop简介01MapReduce简介021Hadoop简介HadoopHadoop Hadoop是一套分布式系统基础框架,它能够在基于商用硬件构建的大型集群环境运行分布式应用程序。用户可在不了解底层细节的前提下基于Hadoop框架运行分布式程序,而Hadoop框架将为分布式程序提供可靠性和数据处理能力。 Hadoop Hadoop实现了MapReduce编程模型,它能够将分布式应用程序自动的分成小的工作片段,每一个工作片段都可以在集群的任何节点执行。 Hadoop还提供了一个分布式文件系统(HDFS),用户可以在计算节点存储数据。HDFS具有高容错性的特点,能够提供高吞吐量来访问应用程序的数据。2MapReduce MapReduce Map/Reduce是一种编程模型,它通过使用基于键值对数据集的分布式操作序列实现大型分布式计算。Hadoop Map/Reduce框架能够将一组硬件设备构建为计算集群并在该集群的节点上执行用户定义的Map/Reduce作业。 Map/ReduceMapReduce分为两个阶段:Map阶段和Reduce阶段Map阶段 在Map阶段,框架将输入数据集分拆为大量的片段,将每个片段分配给各个Map任务。 框架还为运行其Map任务的所有集群节点上分发大量的Map任务,每个Map任务都从框架为其分配的数据集片段中获取键值对数据,经过计算后生成新的键值对数据。 Map任务将调用用户定义的Map函数完成每一个键值对数据的转化,从而转化为新的键值对数据。 Map阶段结束后,框架将对新生成的键值对数据进行排序,生成一组键值对元组,使得与特定键值相关联的所有值实现聚合。之后,框架将键值对元组集拆分为与Reduce任务数量相同的片段。Reduce阶段 在Reduce阶段,每个Reduce任务都会从框架为其分配的数据集片段中获取键值对元组片段作为输入数据,调用用户定义的Reduce函数进行计算,完成将元组转化为输出键值对数据。 与Map阶段机制相同,Reduce阶段框架也会为运行Reduce任务的所有集群节点上分发大量的Reduce任务,并将键值对元组数据片段发送给每个Reduce任务。?1、hadoop2、MapReduceHadoop是一套分布式系统基础框架,它能够在基于商用硬件构建的大型集群环境运行分布式应用程序。用户可在不了解底层细节的前提下基于Hadoop框架运行分布式程序,而Hadoop框架将为分布式程序提供可靠性和数据处理能力。Hadoop实现了MapReduce编程模型,它能够将分布式应用程序自动的分成小的工作片段,每一个工作片段都可以在集群的任何节点执行。Hadoop还提供了一个分布式文件系统(HDFS),用户可以在计算节点存储数据。HDFS具有高容错性的特点,能够提供高吞吐量来访问应用程序的数据。Hadoop是一套分布式系统基础框架,它能够在基于商用硬件构建的大型集群环境运行分布式应用程序。用户可在不了解底层细节的前提下基于Hadoop框架运行分布式程序,而Hadoop框架将为分布式程序提供可靠性和数据处理能力。Hadoop实现了MapReduce编程模型,它能够将分布式应用程序自动的分成小的工作片段,每一个工作片段都可以在集群的任何节点执行。Hadoop还提供了一个分布式文件系统(HDFS),用户可以在计算节点存储数据。HDFS具有高容错性的特点,能够提供高吞吐量来访问应用程序的数据。Map/Reduce是一种编程模型,它通过使用基于键值对数据集的分布式操作序列实现大型分布式计算。Hadoop Map/Reduce框架能够将一组硬件设备构建为计算集群并在该集群的节点上执行用户定义的Map/Reduce作业。在Map阶段,框架将输入数据集分拆为大量的片段,将每个片段分配给各个Map任务。框架还为运行其Map任务的所有集群节点上分发大量的Map任务,每个Map任务都从框架为其分配的数据集片段中获取键值对数据,经过计算后生成新的键值对数据。Map任务将调用用户定义的Map函数完成每一个键值对数据的转化,从而转化为新的键值对数据。Map阶段结束后,框架将对新生成的键值对数据进行排序,生成一组键值对元组,使得与特定键值相关联的所有值实现聚合。之后,框架将键值对元组集拆分为与Reduce任务数量相同的片段。

文档评论(0)

胡老师K12教育坊 + 关注
实名认证
内容提供者

从业20余年,中学高级教师,擅长公开课PPT制作等。

1亿VIP精品文档

相关文档