- 0
- 0
- 约6.38万字
- 约 9页
- 2026-03-06 发布于北京
- 举报
SSM-RDU:适用于长序列状态空间模型的可
重构数据流单元
ShoKoKunleOlukotun
IMachines,IncDepartmentofElectricalEngineering
SantaClara,CA,USAStanfordUniversity
kosho2013@Stanford,CA,USA
kunle@
摘要—长序列状态空间模型(SSMs),如Hyena和scan内核)本质上是低效的,这些内核涉及不规则的内
Mamba,用更高效的FFT和扫描操作替换了自注意力的二存访问模式、数据相关的计算以及较低的算术强度。强
本次复杂性。然而,现代加速器如GPU由于执行模型僵化且专为制在GPU的张量核心上使用非GEMM内核会导致次
密集矩阵运算而设计,对这些非GEMM工作负载并不
您可能关注的文档
- 只需说一句话: 无注释细粒度对象计数.pdf
- 用于从噪声光电容积脉搏波信号中稳健提取心率的自监督自动 编码器网络:将盲源分离应用于生物信号分析.pdf
- 相关性如何出现:对 LLM 重排序中的 LoRA 微调的机 制分析.pdf
- AR-1-to-3: 单幅图像通过下一视角预测生成一致的 3D 物体.pdf
- SCReedSolo: 基于随机对称加密和里德-所 罗门编码的安全鲁棒 LSB 图像隐写框架.pdf
- 评估加速 MRI 中的结构不确定性:体素测量是否是有效的替代指标?.pdf
- 无地图障碍物避碰飞行通过在复杂环境中使用双重 KD 树的模型预测控制.pdf
- 规划编制以在规划时间推理目标实现.pdf
- 黑曼巴流:一种面向黑曼巴的端到端光流估计架构.pdf
- L-融合:拉普拉斯胎儿超声分割与不确定性估计.pdf
最近下载
- 华鑫证券-汽车行业智能驾驶系列研究(二):Robotaxi的商业模式前景展望-240919.pdf VIP
- QB_T 5271-2018电动升降桌.pdf
- T_ISC 0045-2024 MA 标识解析体系 总体架构.docx VIP
- 基于STM32的智能门锁设计.docx VIP
- 2026-2030中国自动移液工作站行业市场发展趋势与前景展望战略分析研究报告.docx VIP
- 电力工程用地用地指标.docx VIP
- 23S516 混凝土排水管道基础及接口 .docx VIP
- 关于项目用预备费的请示.doc
- 小学数学 人教版 基础教育精品课 课件教案-6年级数学下册46 比例的意义_学科课程精品课_邓佳琳_重庆师范大学附属实验小学校邓佳琳《比例的意义》课件课件.pptx
- 医务人员依法执业培训试题及答案.docx
原创力文档

文档评论(0)