- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一种用于精确的33矩阵乘法的60加法、秩23
方案
JoshuaStapleton
DepartmentofMathematics,ImperialCollegeLondon
本jbs123@ic.ac.uk
译2025年8月8日
中
1
v摘要
7
5我们将一般(非交换)矩阵乘法的加性成本从之前的记录61
8
3(Schwartz-Vaknin,2023)[11]和62(Mårtensson–Wagner,2025)[9]
0降低到,而没有改变基。据我们所知,这代表了最新的技术水平。
.
8
0Keywords:矩阵乘法;加性复杂度;快速算法;三元权重;验证
5
2
:
v
i1介绍
x
r
a矩阵乘法运行着现代世界。对于ChatGPT每写的一个词,我们估计必
1
须计算个小矩阵乘积。由于大多数数字工作流程所需的极端大量
的矩阵乘法,即使在基本矩阵乘法算法方面有边际改进也能转化为全球范围
内的显著成本和能源节约。
在一个快速矩阵乘法算法中,乘法复杂度(通常称为秩)是指执行的标
量积的数量,加法复杂度是形成那些积和组装结果所使用的总标量加法或减
法的数量,算术复杂度仅仅是这两者的和,即执行的总标量操作数。寻求越
1使用Kaplan等。[6]提出的基于标记级别的FLOP模型forward,一个拥有175B
参数的模型需要次融合乘加运算来生成每个标记,即当映射到现代GPU/TPU
GEMM中使用的32×32内核时,次微矩阵乘积。
1
来越小的矩阵乘法算术电路的动力既促进了理论界限的发展,也推动了实际
内核的进步,这始于Strassen的里程碑分解。在1969年,Strassen[12]
发现了一种新算法,将计算任意22矩阵积所需的“秩”(大致相当于乘法
的数量)从朴素的=8减少到了7,从而开始了发现更快矩阵乘法算
法的密集努力,这一工作持续至今。Laderman(1976)[7]发现了一种秩-算
法用于情况:这是该问题至今已知的最佳上界。随着乘法秩似乎在近
五十年内固定为23,后续工作转向削减Laderman类型方案的加法成本,使
用图论分析和自动化搜索启发式算法[3,5,9]。Schwartz和Vaknin随后通
过利用另一种基底和一种置石启发式算法将Laderman的-加形式减少到
61次加法[11]。
近年来,深度学习辅助的算法发现进入了聚光灯下。Elser(2016)使用
保守学习网络分别“重新发现”了Strassen和Laderman式的秩7和秩23
方案[4]。在2022年,DeepMind的强化学习系统AlphaTensor发现了44
情况下新的最先进的(SOTA)方案[2],将乘法秩从49(Strassen递归)减少
到47次标量乘法(在中)。最近的结果(也来自DeepMind)将44复
值矩阵乘法的乘法秩从Strassen的49降低到了4
您可能关注的文档
- SocialPulse: 一款用于检测现实世界社交互动的智能手表系统.pdf
- 基于置信度加权的标记集覆盖用于早期假设剪枝在自洽性中.pdf
- 加速通过多文档摘要影响排序论文的科学研究发现.pdf
- 辅助迭代局部分割的策略:优化模态和位置选择以实现前列腺癌定位.pdf
- 测量推荐系统的稳定性和可塑性.pdf
- 马尔可夫链估计与上下文学习中的估算.pdf
- 基于点的形状表示生成与保对应扩散模型.pdf
- 数据驱动的频谱需求预测:基于迁移学习的时空框架.pdf
- CASH:上下文感知智能切换以实现空中文走廊上可靠无人机连接.pdf
- 评估研究软件中的供应链安全 一项使用 OpenSSF 评分卡对 3,248 个代码库的经验评估.pdf
- 同理心指南以提升从业人员福祉及软件工程实践.pdf
- 探究和增强基于 GNN 的 QEC 解码器的鲁棒性与强化学习附录.pdf
- 基于 GNN 的 QEC 解码器是否需要经典知识?评估从 MWPM 中知识蒸馏的有效性.pdf
- 宽恕与遗忘?一种工业 5.0 视角下的人机协作拣选中信任疲劳共同调节方法.pdf
- 闪存通信 V2:比特分割和脉冲保留用于任意比特通信.pdf
- 通过布局保留内容替换生成合成发票.pdf
- M3 高级水平: 基于高低级特征一致性的互 mask 混合半监督医学图像分割.pdf
- 模块化变压器架构在精准农业成像中的应用.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)