Spark平台中任务执行时间预测的方法的研究.docVIP

  • 134
  • 0
  • 约4.42千字
  • 约 8页
  • 2018-10-11 发布于福建
  • 举报

Spark平台中任务执行时间预测的方法的研究.doc

Spark平台中任务执行时间预测的方法的研究

Spark平台中任务执行时间预测的方法的研究   摘要:Spark是一种新型分布式海量数据处理平台,在应用执行过程中,Spark以任务作为最小执行单元。因此,任务执行时间预测是指导Spark进行性能分析、优化资源调度以及故障监控的基础。在Spark平台中,由于计算数据分布不均及网络资源的共享,导致同样计算逻辑的任务在不同计算节点上执行的时间可能产生很大差异,需根据实时运行环境进行动态预测。通过结合任务在不同节点所需数据量以及集群网络状况,对任务在不同节点的执行时间进行预测。实验表明,该方法对任务进行预估,误差可保证在19%以内,任务执行时间预估算法对Spark调优有一定的指导作用。   关键词:大数据;Spark;预测;分布式;任务   DOIDOI:10.11907/rjdk.171509   中图分类号:TP306   文献标识码:A 文章编号:1672-7800(2017)012-0019-03   Abstract:Spark is a new distributed big data processing platform. In the implementation of Spark, task is the minimum execution unit. Therefore, the prediction of the execution time of

文档评论(0)

1亿VIP精品文档

相关文档