- 1
- 0
- 约1.03万字
- 约 6页
- 2026-04-29 发布于湖北
- 举报
基于流式幂迭代的Muon实现:2.加速
在第⼀篇⽂章《基于流式幂迭代的Muon实现:1.初识》中,笔者将流式幂迭代(StreamingPowerIteration)单独抽象出来,作为⼀种新的Muon实现⽅式。由于
新⽅案是直接对SVD进⾏近似计算,所以相⽐基于Newton-Schulz迭代的标准实现,它具有更丰富的拓展空间,值得继续深⼊研究。
从计算上看,新⽅案的主要变化是Newton-Schulz迭代换成了QR分解,这带来了⼀些降速。上篇我们已讨论了⼀些基本的加速⼿段,但尚未⽐肩标准实现。这篇
⽂章我们继续研究QR的加速,以求尽可能缩⼩差距。
流式迭代
我们将沿⽤第⼀篇⽂章的所有概念和记号,有相关疑惑的读者请先往前翻看⼀下。⾸先,Muon的更新公式是
Mt=βMt−1+Gt
(1)
您可能关注的文档
- MuP之上:4. 坚守参数的稳定性(数学研究) .pdf
- 基于流式幂迭代的Muon实现:3. 雕琢(数学研究) .pdf
- 基于流式幂迭代的Muon实现:4. 原理(数学研究) .pdf
- 基于流式幂迭代的Muon实现:5. 延伸(数学研究) .pdf
- 中位数(Median)简介(数学研究).pdf
- 2025 科学智能(AI4S)与大模型驱动科研范式变革白皮书.pdf
- 切割机器人系列编程:Gerber AccuMark_(15).与其他生产线系统的集成.docx
- 切割机器人系列编程:Gerber AccuMark_(16).安全操作规程.docx
- 2025 跨境电商 ESG 实践与绿色物流全球合规白皮书.pdf
- 切割机器人系列编程:Gerber AccuMark_(14).编程与脚本编写.docx
- 切割机器人系列编程:Komatsu Seiren Cutting System_(1).切割机器人系列编程基础.docx
- Unit 5理解课文精研读:速读P50-51,阅读判断题.pdf
- 切割机器人系列编程:Komatsu Seiren Cutting System_(2).KomatsuSeiren切割系统硬件介绍.docx
- 小村庄故事:环境保护与生态平衡警示.pdf
- 切割机器人系列编程:Komatsu Seiren Cutting System_(5).材料识别与处理技术.docx
- 切割机器人系列编程:Komatsu Seiren Cutting System_(6).切割精度控制方法.docx
- 切割机器人系列编程:Komatsu Seiren Cutting System_(7).安全操作与故障排除.docx
- 切割机器人系列编程:Komatsu Seiren Cutting System_(8).切割机器人维护与保养.docx
- 2026届江西省宜丰中学高三下学期第二次“战疫”线上教学综合测试物理试题含解析.doc
- 汉坦病毒传染力强弱特点分析.pptx
最近下载
- 在线监测管理制度(3篇).docx
- 高空作业车工作臂设计及有限元分析设计说明书.doc
- 汽车离合器设计_很全.doc VIP
- (汇川培训.ppt VIP
- 2024-2015年乳制品(中证Ⅳ)行业均值、偿债、营运、盈利、发展、现金流能力均值.doc
- 《桥式起重机主体结构部分的设计及主梁和端梁的校核计算》-毕业设计论文(学术).doc VIP
- 基于SpringBoot的仓库管理系统的设计与实现.docx VIP
- 2025年上海市中考英语试题卷(含答案).docx
- 专职消防员考试100题.docx VIP
- 2.4石油资源与国家安全 课件 湖南省长郡中学2021-2022学年高二下学期地理湘教版(2019)选择性必修3.pptx VIP
原创力文档

文档评论(0)