低延迟计算任务调度准则.docxVIP

  • 0
  • 0
  • 约1.25万字
  • 约 21页
  • 2026-07-06 发布于湖北
  • 举报

低延迟计算任务调度准则

低延迟计算任务调度准则

一、(1)异构硬件感知的任务切分与映射准则。在低延迟计算任务的调度体系中,硬件资源的异构性是首要考量因素,调度准则必须建立在对CPU、GPU、NPU、FPGA等不同算力单元性能特征深度感知的基础之上。对于计算密集型且逻辑分支较少的任务,如深度学习推理中的矩阵乘加运算,应优先映射至GPU或NPU执行,利用其大规模并行计算能力压缩单任务处理耗时;而对于逻辑控制复杂、分支判断频繁的事务型任务,则需保留在CPU端处理,避免因指令流水线中断导致额外延迟。在具体实施层面,调度系统需预先构建硬件能力画像,不仅记录各计算单元的峰值算力、内存带宽,还需实时采

文档评论(0)

1亿VIP精品文档

相关文档