- 1
- 0
- 约1.33万字
- 约 6页
- 2026-04-29 发布于湖北
- 举报
基于流式幂迭代的Muon实现:3.雕琢
回顾前两篇⽂章《基于流式幂迭代的Muon实现:1.初识》和《基于流式幂迭代的Muon实现:2.加速》,我们引⼊了Muon的流式幂迭代(StreamingPowerIteratio
n)实现⽅案,初步验证了它的可⾏性,并进⼀步讨论了核⼼运算——QR分解——的加速,使其接近Newton-Schulz迭代实现的效率。
在这篇⽂章中,我们不再局限于优化单步的QR分解,⽽是从更整体的视⻆看待流式幂迭代,并结合具体的计算背景,对其实现细节做进⼀步的“精雕细琢”,尽可能
减少计算瓶颈,使其效率趋近理论极限。
现有结果
流式幂迭代本质上是“边训练边SVD”,它的想法是通过幂迭代来求SVD,并通过缓存上⼀步的结果,将计算平摊到每⼀步训练上,使得在优化器中嵌⼊SVD成为可能
。⾄于Muon,只不过是它的⼀个基本应⽤,因为Muon的核⼼运算msign最基本的实现⽅式就是SVD。具体来说,Muon的更新公式是
Mt=βMt−1+Gt
您可能关注的文档
最近下载
- 天津市居住区-公共服务设施配置标准.doc VIP
- 23. 妇产科学2025年期末考试试卷.docx
- 倪海厦-人纪-金匮要略.doc VIP
- 雷龙鱼饲养手册.pdf VIP
- 空间几何体的外接球与内切球问题 (典型例题+题型归类练) (含答案)高考数学一轮复习解答题拿分秘籍(新高考专用).docx VIP
- 旅游餐馆星级的划分与评定(2021修订版).pdf VIP
- 六年级-记叙文阅读.pptx VIP
- 2025年 广州医科大学附属医院招聘笔试考试试卷[附答案].docx
- 2008年天津市居住区公共服务设施配置标准2008.9.1日实施.pdf VIP
- 考点总结课后答案奥本海姆信号与系统第2版下册考研资料.docx VIP
原创力文档

文档评论(0)