计算机体系结构-第6章+向量体系结构.pptVIP

  • 4
  • 0
  • 约9.46千字
  • 约 52页
  • 2023-11-25 发布于江苏
  • 举报

计算机体系结构-第6章+向量体系结构.ppt

5.2 消除相关计算 * 相关计算的最重要形式之一是:“递归” 例: for (i=9999; i=0; i=i-1) sum = sum + x[i] * y[i]; 存在循环间相关 改写为: for (i=9999; i=0; i=i-1) sum [i] = x[i] * y[i]; (不存在循环间相关) for (i=9999; i=0; i=i-1) finalsum = finalsum + sum[i]; (约简reduction) 5.2 消除相关计算 * 在向量和SIMD体系结构中,约简可由特殊硬件处理。 假定由10处理器,每个处理器并行执行以下运算(p为0~9) for (i=999; i=0; i=i-1) finalsum[p] = finalsum[p] + sum[i+1000*p]; 最后用简单的循环完成最后10个总和的计算 6 交叉问题 * 能耗与DLP 如果将数据级并行体系结构的时钟频率折半、执行资源加倍,性能和原来是一样的。 在降低时钟频率的同时降低电压,就可以降低计算过程的功耗和功率。 DLP处理器的时钟频率低于系统处理器,系统处理器依靠高时钟频率来提高性能。 图形存储器 专为GPU设计的特殊DRAM,称为GDRAM 与传统DRAM

文档评论(0)

1亿VIP精品文档

相关文档