SSM-RDU:适用于长序列状态空间模型的可重构数据流单元.pdfVIP

  • 0
  • 0
  • 约6.38万字
  • 约 9页
  • 2026-03-06 发布于北京
  • 举报

SSM-RDU:适用于长序列状态空间模型的可重构数据流单元.pdf

SSM-RDU:适用于长序列状态空间模型的可

重构数据流单元

ShoKoKunleOlukotun

IMachines,IncDepartmentofElectricalEngineering

SantaClara,CA,USAStanfordUniversity

kosho2013@Stanford,CA,USA

kunle@

摘要—长序列状态空间模型(SSMs),如Hyena和scan内核)本质上是低效的,这些内核涉及不规则的内

Mamba,用更高效的FFT和扫描操作替换了自注意力的二存访问模式、数据相关的计算以及较低的算术强度。强

本次复杂性。然而,现代加速器如GPU由于执行模型僵化且专为制在GPU的张量核心上使用非GEMM内核会导致次

密集矩阵运算而设计,对这些非GEMM工作负载并不

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档