数据分析应用.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一届 全国高校 云计算 创新应用大赛宣讲;;;;;;;;;;电子 商务;云计算正在改变 我们生活的方方面面;;IaaS;;;;什么是虚拟化?;为什么需要虚拟化技术?;虚拟化与云计算;虚拟化在云计算中的开源实现-OpenStack;OpenStack能做什么;OpenStack包含主要项目(模块);OpenStack的计算架构;什么是云存储?;分布式存储;数据分布;一致性Hash;数据副本;数据副本;云存储与传统存储的不同;云存储的应用;云存储的挑战;云环境下大数据处理;MR编程模式及Hadoop的实现方式;MR编程模式及Hadoop的实现方式;读入数据: key/value 对的记录格式数据 Map: 从每个记录里extract something map (in_key, in_value) - list(out_key, intermediate_value) 处理input key/value pair 输出中间结果key/value pairs Shuffle: 混排交换数据 把相同key的中间结果汇集到相同节点上 Reduce: aggregate, summarize, filter, etc. reduce (out_key, list(intermediate_value)) - list(out_value) 归并某一个key的所有values,进行计算 输出合并的计算结果 (usually just one) 输出结果 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;案例:单词记数问题(Word Count) 给定一个巨大的文本(如1TB),如何计算单词出现的数目? ;使用MapReduce求解该问题 定义Map和Reduce函数 ;使用MapReduce求解该问题 Step 1: 自动对文本进行分割 ;使用MapReduce求解该问题 Step 2:在分割之后的每一对key,value进行用户定义的Map进行处理,再生成新的key,value对 ;使用MapReduce求解该问题 Step 3:对输出的结果集归拢、排序shuffle(系统自动完成) ;使用MapReduce求解该问题 Step 4:通过Reduce操作生成最后结果 ;;航天飞机重110吨 外掛燃料筒重756吨 两个固体火箭推进器 重1,142吨 共计2,008吨 AMS重7.5吨;;;;;;;第一届 全国高校 云计算 创新应用大赛;;;;;;;;;;;欢迎大家积极参赛 Thanks

文档评论(0)

189****0315 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档