第二届全国高校云计算应用创新大赛宣讲要点分析.pptxVIP

下载本文档

2
0
约2.07千字
约 72页
2016-11-17 发布于湖北
举报
版权申诉

第二届全国高校云计算应用创新大赛宣讲要点分析.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二届全国高校云计算应用创新大赛宣讲;;;;;;;;;;电子商务;云计算正在改变我们生活的方方面面;;;IaaS;云的发展- IaaS, PaaS, SaaS ;IaaS: Cut IT expense and complexity through a cloud enabled data center;云到底在哪里?;;;;IaaS相关技术;什么是虚拟化？;为什么需要虚拟化技术？;虚拟化与云计算;虚拟化在云计算中的开源实现——OpenStack;OpenStack能做什么;PaaS相关技术;云环境下大数据处理——Hadoop;MR编程模式及Hadoop的实现方式;MR编程模式及Hadoop的实现方式;读入数据: key/value 对的记录格式数据 Map: 从每个记录里extract something map (in_key, in_value) - list(out_key, intermediate_value) 处理input key/value pair 输出中间结果key/value pairs Shuffle: 混排交换数据把相同key的中间结果汇集到相同节点上 Reduce: aggregate, summarize, filter, etc. reduce (out_key, list(intermediate_value)) - list(out_value) 归并某一个key的所有values，进行计算输出合并的计算结果 (usually just one) 输出结果 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;Google MapReduce并行处理的基本过程 ;案例：单词记数问题(Word Count) 给定一个巨大的文本（如1TB），如何计算单词出现的数目？ ;使用MapReduce求解该问题定义Map和Reduce函数 ;使用MapReduce求解该问题 Step 1: 自动对文本进行分割 ;使用MapReduce求解该问题 Step 2:在分割之后的每一对key,value进行用户定义的Map进行处理，再生成新的key,value对 ;使用MapReduce求解该问题 Step 3:对输出的结果集归拢、排序shuffle(系统自动完成） ;使用MapReduce求解该问题 Step 4:通过Reduce操作生成最后结果 ;图计算编程模式及实现方式;分布式图计算;基于Spark的图存储;基于Spark的分布式处理;class Graph [ V, E ] { def Graph(vertices: Table[ (Id, V) ], edges: Table[ (Id, Id, E) ]) // Table Views ----------------- def vertices: Table[ (Id, V) ] def edges: Table[ (Id, Id, E) ] def triplets: Table [ ((Id, V), (Id, V), E) ] // Transformations ------------------------------ def reverse: Graph[V, E] def subgraph(pV: (Id, V) = Boolean, pE: Edge[V,E] = Boolean): Graph[V,E] def mapV(m: (Id, V) = T ): Graph[T,E] def mapE(m: Edge[V,E] = T ): Graph[V,T] // Joins ---------------------------------------- def joinV(tbl: Table [(Id, T)]): Graph[(V, T), E ] def joinE(tbl: Table [(Id, Id, T)]): Graph[V, (E, T)] // Computation ---------------------------------- def mrTriplets(mapF: (Edge[V,E]) = List[(Id, T)], reduceF: (T, T) = T): Graph[T, E] } ;Spark的例子（寻找最大的年龄）;子图匹配应用;子图匹配问题;参考思路（步骤1-将查询图分解成若干子图