- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
孟繁兴
010203目录Spark的发展历史Spark应用场景Spark简介
Spark简介快速、分布式、可扩展、容错的集群计算框架;Spark是基于内存计算的大数据分布式计算框架低延迟的复杂分析;Spark是Hadoop MapReduce的替代方案。MapReudce不适合迭代和交互式任务,Spark主要为交互式查询和迭代算法设计,支持内存存储和高效的容错恢复。Spark拥有MapReduce具有的优点,但不同于MapReduce,Spark中间输出结果可以保存在内存中,减少读写HDFS的次数
Spark的发展历史
Spark应用场景数据工程师可以利用Spark进行数据分析与建模,由于Spark具有良好的易用性,数据工程师只需要具备一定的SQL语言基础、统计学、机器学习等方面的经验,以及使用Python、Matlab或者R语言的基础编程能力,就可以使用Spark进行上述工作。大数据工程师将Spark技术应用于广告、报表、推荐系统等业务中,在广告业务中,利用Spark系统进行应用分析、效果分析、定向优化等业务,在推荐系统业务中,利用Spark内置机器学习算法训练模型数据,进行个性化推荐及热点点击分析等业务。数据科学数据处理
Spark应用场景图 谷歌趋势:Spark与Hadoop对比Spark如今已吸引了国内外各大公司的注意,如腾讯、淘宝、百度、亚马逊等公司均不同程度地使用了Spark来构建大数据分析应用,并应用到实际的生产环境中
Spark应用场景 腾讯广点通是最早使用Spark的应用之一。腾讯大数据精准推荐借助Spark快速迭代的优势,围绕“数据+算法+系统”这套技术方案,实现了在“数据实时采集、算法实时训练、系统实时预测”的全流程实时并行高维算法,最终成功应用于广点通pCTR投放系统上,支持每天上百亿的请求量。 淘宝淘宝技术团队使用了Spark来解决多次迭代的机器学习算法、高计算复杂度的算法等,将Spark运用于淘宝的推荐相关算法上,同时还利用GraphX解决了许多生产问题,包括以下计算场景:基于度分布的中枢节点发现、基于最大连通图的社区发现、基于三角形计数的关系衡量、基于随机游走的用户属性传播等。
您可能关注的文档
最近下载
- 2024年新高考化学命题特点及江西卷试题分析.pptx
- 县区域水土保持评估实施细则.docx
- (医学课件)PICC维护课件.ppt
- 第四单元 三国两晋南北朝时期:政权分立与民族交融 教学设计 2023-2024学年统编版七年级历史上册.docx
- Unit 2 Different families 单元整体(教学设计)-2024-2025学年人教PEP版(2024)英语三年级上册.docx
- 2024煤矿安全生产标准化管理体系解读.docx VIP
- 算法设计与分析 第2版 第9章-图算法设计.ppt
- 标准化服务在政务服务中的应用考核试卷.docx
- 2023年《全日制普通高中物理新课程标准》.pdf
- 人教PEP三年级英语上册《Unit1 Making friends part A》课件.pptx VIP
文档评论(0)