- 1、本文档共55页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最优化Spark应用的性能
-- 使用高性价比的层次化方案加速大数据处理
Yucai, Yu (
BDT/STO/SSG April, 2016
About me/us
• Me: Spark contributor, previous on virtualization, storage, OS etc.
• Intel Spark team, working on Spark upstream development and
x86 optimization, including: core, Spark SQL, Spark R, GraphX,
machine learning etc.
• Top 3 contribution in 2015, 3 committers.
• Two publication:
Intel Confidential 4/23/2016 2
Agenda
• General software tuning
• Bring up 3x performance with NVMe SSD
• NVMe SSD Overview
• Use NVMe SSD to accelerate computing
• Why SSD is important to Spark
Intel Confidential 4/23/2016 3
General software tuning
• Resource allocation
• Serialization
• Partition
• IO
• MISC
Intel Confidential 4/23/2016 4
Resource Allocation - CPU
• spark.executor.cores – recommend 5 cores per executor*
- Less core number (like single-core per executor) introduces JVM overhead.
e.g., multiple broadcast copies
- More cores number may hard to apply big resource
- To achieve full write throughput onto HDFS
• Number of executors per node – cores per node / 5 * (1 ~ 0.9)
* /blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/
Intel Confidential 4/23/2016 5
Resource Allocation - Memory
• spark.executor.memory – memory size per executor
- Leave 10-15% total memory for OS cache: dcache, page cache etc.
- memory per node * (85-90)% / executors per node
- 2-5 GB per core: 2-5GB * spark.executor.cores
• spark.yarn.executor.memoryOverhead – indicate for offhe
您可能关注的文档
- 国内外原料药市场的发展趋势及监管现状.pdf
- 国内外管理方法.pdf
- RG000022 无线网络优化业务流程 ISSUE1.1.pdf
- 苏州供电公司业务流程优化设计项目行业描述文档.pdf
- 国际汇兑与结算第八章.pdf
- 第九章 国际货款的支付.pdf
- PTA供应链物流环节的分析与优化.pdf
- WCDMA移动通信系统中邻区优化方案的研究和应用.pdf
- Primavera软件基础 应用规划.pdf
- 思源_元龙国际项目产品优化及营销策略建议方案_.pdf
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- 《市政排水管道气囊封堵施工规程》.pdf
- TOPRAAD920印刷模切开槽机.pdf VIP
- 单相整流电路建模与仿真.doc VIP
- 缺血性脑血管病临床管理指南解读.pptx VIP
- 工程概算预算审核方案(3篇).docx VIP
- 神经重症气管切开患者气道功能康复与管理专家共识2024.pptx VIP
- 2025年监理工程师之监理概论考试题库及答案(名师系列).docx VIP
- 2025年监理工程师之监理概论押题练习试卷B卷附答案 .pdf VIP
- 2025年监理工程师之监理概论考试题库及完整答案(必刷).docx VIP
- 2025年监理工程师之监理概论押题练习试卷A卷附答案 .pdf VIP
文档评论(0)