Hadoop技术介绍及应用探讨v6研讨.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hadoop技术介绍及应用探讨v6研讨

提纲;大数据现象;大数据现象;大数据典型特征;广义的大数据;1、Hadoop历程 2、Hadoop相关项目 3、定义;1、Hadoop历程;2、Hadoop相关项目;(2)GigaOM总结的Hadoop生态系统图 ;Just A Tool 能够对大量数据进行分布式处理的软件框架; 实现了Google的MapReduce编程模型和框架; 把应用程序分割成小工作单元,并将其放到集群节点上执行(先分后合)。 分两个方面 分布式存储; 并行计算。;1、架构特点—主从结构 2、功能模块—三架马车 3、新版本升级— YARN出现 4、集群搭建实例;1、架构特点;文件系统 Master-Slave 结构 NameNode节点记录文件系统的元数据; Slave节点分别存储数据; 文件系统有块的概念。;Task Master-Slave 结构 作业提交节点直接与客户端连接; jobtracker进行任务的分配; tasktracker负责完成任务。;;HDFS是Hadoop中的核心技术,完成基本存储; 在廉价PC集群上运行; 访问模式为流式??据; 冗余与多副本机制保证数据存储的可靠性; 负载均衡控制集群中数据的存储分布。;;本质是函数式编程,为使用者提供一个框架; 程序可应用于不同规模的集群; 该框架下,所有的操作都分为两类; 框架底层实现将数据集划分为Spilts; 作业中输出文件和输入文件都保存在HDFS上。 ;;;HDFS之上的数据库; 居于NoSQL和关系数据库之间,存储结构化较弱的数据; 每个值的数据形式是字符串,不区分类型。;;;;;4、集群搭建实例;4、集群搭建实例;4、集群搭建实例;4、集群搭建实例;4、集群搭建实例;1、成功应用案例 2、石油勘探领域中的应用探讨;1、成功应用案例;;1、成功应用案例;1、成功应用案例;;;1、下一代Hadoop 2、展望;YARN调度框架的完善 支持更多的资源类型(网络、磁盘等); 支持更多的调度语义。 长作业(streaming)的在线升级 Strom在线升级; Container资源动态调整。 容错机制 ResourceManager自身容错; NodeManager宕掉,任务不受影响; ApplicationMaster个性化容错。

文档评论(0)

骨干 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档