- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二届
全国高校
云计算
应用创新大赛宣讲;;;;;;;;;;电子
商务;云计算正在改变
我们生活的方方面面;;;IaaS;云的发展- IaaS, PaaS, SaaS ;IaaS: Cut IT expense and complexity through a cloud enabled data center;云到底在哪里?;;;;IaaS相关技术;什么是虚拟化?;为什么需要虚拟化技术?;虚拟化与云计算;虚拟化在云计算中的开源实现——OpenStack;OpenStack能做什么;PaaS相关技术;云环境下大数据处理——Hadoop;MR编程模式及Hadoop的实现方式;MR编程模式及Hadoop的实现方式;读入数据: key/value 对的记录格式数据
Map: 从每个记录里extract something
map (in_key, in_value) - list(out_key, intermediate_value)
处理input key/value pair
输出中间结果key/value pairs
Shuffle: 混排交换数据
把相同key的中间结果汇集到相同节点上
Reduce: aggregate, summarize, filter, etc.
reduce (out_key, list(intermediate_value)) - list(out_value)
归并某一个key的所有values,进行计算
输出合并的计算结果 (usually just one)
输出结果
;Google MapReduce并行处理的基本过程
;Google MapReduce并行处理的基本过程
;Google MapReduce并行处理的基本过程
;Google MapReduce并行处理的基本过程
;案例:单词记数问题(Word Count)
给定一个巨大的文本(如1TB),如何计算单词出现的数目?
;使用MapReduce求解该问题
定义Map和Reduce函数
;使用MapReduce求解该问题
Step 1: 自动对文本进行分割
;使用MapReduce求解该问题
Step 2:在分割之后的每一对key,value进行用户定义的Map进行处理,再生成新的key,value对
;使用MapReduce求解该问题
Step 3:对输出的结果集归拢、排序shuffle(系统自动完成)
;使用MapReduce求解该问题
Step 4:通过Reduce操作生成最后结果
;图计算编程模式及实现方式;分布式图计算;基于Spark的图存储;基于Spark的分布式处理;class Graph [ V, E ] {
def Graph(vertices: Table[ (Id, V) ],
edges: Table[ (Id, Id, E) ])
// Table Views -----------------
def vertices: Table[ (Id, V) ]
def edges: Table[ (Id, Id, E) ]
def triplets: Table [ ((Id, V), (Id, V), E) ]
// Transformations ------------------------------
def reverse: Graph[V, E]
def subgraph(pV: (Id, V) = Boolean,
pE: Edge[V,E] = Boolean): Graph[V,E]
def mapV(m: (Id, V) = T ): Graph[T,E]
def mapE(m: Edge[V,E] = T ): Graph[V,T]
// Joins ----------------------------------------
def joinV(tbl: Table [(Id, T)]): Graph[(V, T), E ]
def joinE(tbl: Table [(Id, Id, T)]): Graph[V, (E, T)]
// Computation ----------------------------------
def mrTriplets(mapF: (Edge[V,E]) = List[(Id, T)], reduceF: (T, T) = T): Graph[T, E]
}
;Spark的例子(寻找最大的年龄);子图匹配应用;子图匹配问题;参考思路(步骤1-将查询图分解成若干子图
原创力文档


文档评论(0)