混合CPU-GPU加速矩阵的Hessenberg约化讲义.pdfVIP

  • 23
  • 0
  • 约2.61万字
  • 约 10页
  • 2017-11-28 发布于江苏
  • 举报

混合CPU-GPU加速矩阵的Hessenberg约化讲义.pdf

第 l5卷 第29期 2015年 10月 科 学 技 术 与 工 程 V0l_15 No.29 Oct.2015 1671— 1815(2015)29—0158—07 ScienceTechnologyandEngineering ⑥ 2015 Sci.Tech.Engrg. 计算机技术 混合 CPU-GPU加速矩阵的Hessenberg约化 沈 聪 曹 婷 宋金文 高火涛 (武汉大学电子信息学院 ;61195部队武汉军事代表室 ,武汉 430072) 摘 要 求解一般矩阵特征值问题的第一步即进行Hessenberg约化。给出了矩阵的Hessenberg约化算法在GPU上实现的具 体方案。针对CPU—GPU混合系统,对基于块计算的Hessenberg约化算法进行了计算任务的划分,并通过详细分析每次循环时 各任务的计算量,设计了一种较为合理的分阶段混合调度策略。数值实验表明,使用CPU.GPU混合调度的方案相 比直接使用 CUBLAS库方案平均获得 了约47%的性能提升,而且相比使用CPU上标准的BLAS库函数最高获得 了超过7倍的加速比。 关键词 海森伯格约化 混合系统 混合调度 加

文档评论(0)

1亿VIP精品文档

相关文档