演讲人:宋晓辉
01端侧化算法技术概览
02模型稀疏化压缩
03量化感知训练
04编解码加速
05落地实践
06总结和展望
有限的电量为用户提供端侧AI能力的同时,也不能成为“
有限的电量
为用户提供端侧AI能力的同时,也不能成为“电老
虎”,不能制造续航焦虑,持续的下探端侧AI的能耗水平,需要端侧算法、工程和芯片团队的共同努力。
终端设备内存有限,算法效果需要一定程度上向模型体积和推理精度妥协,因此如何设计和优化端侧模型压缩算法,利用有限的内存占用获得最佳的算法效果,为用户提供流畅、好用的端侧AI功能
您可能关注的文档
- 上海地产洋房年度传播升级思考【AIGC】【全案推广】.docx
- 快消零售牙膏品牌抖音达人投放策划方案【电商】【抖音营销】【投放】.docx
- TimeHF:供应链时序大模型的工业革新.docx
- OPPO数据湖加速大模型训练.docx
- mPLUG-多模态对话大模型技术与应用解析.docx
- MegatronApp:面向万亿参数大模型的训练与推理增强实践.docx
- InfiniSynapse:开拓大模型的第二个杀手级应用场景.docx
- ieval:大模型评测系统建设和应用.docx
- AI大模型评测能力建设及实践.docx
- GB 4053.1-2025《固定式金属梯及平台安全要求 第1部分:直梯》 标准解读.pptx
原创力文档

文档评论(0)