- 4
- 0
- 约3.12千字
- 约 34页
- 2026-02-27 发布于江苏
- 举报
小米大模型端侧部署落地探索
演讲人:黄武伟
小米/大模型算法工程师
CONTENTS
02LLM端侧部署的挑战
01端侧AI的重要性
03相关技术探索
目录
04总结与展望
端侧AI的重要性
在终端设备上直接运行和处理人工智能算法
端侧AI
可靠性:端侧AI减少了对网络连接的依赖,即使在网络不稳定或断开的情况下也能正常工作,提高了系统的鲁棒性。
隐私和安全:所有数据的存储和计算都在本地完成,避免了数据传输到云端可能带来的安全风险。
端侧AI优势
成本效益:端侧AI减少了对云端计算资源的需求,有助于降低成本,特别是在大规模部署时更为明显。
个性化服务:端侧AI可以根据用户的具体使用习惯和偏好提供更加个性化的服务,增强用户体验。
端侧AI优势
小米为什么做端侧AI
l(软件×硬件)Aᴵ
l轻量化、本地部署是小米大模型技术主力突破方向
l小米的端侧设备数量大
LLM端侧部署的挑战
服务器GPU
手机
计算能力
数百TFLOPS的算力(如A100)
相对较低
内存
大容量显存
有限的内存和存储
(通常几个GB到十几GB)
功耗
设计用于高功耗环境,散热要求高
低功耗设计,优化能效
带宽
A100显存带宽接近1.
您可能关注的文档
- 2026年AI大模型-AI Agent 推动 在业务增长中的落地实践-新版课件.pptx
- 2026年AI大模型-ASI从云端降临终端促进放大新智产业链规模效应-新版课件.pptx
- 2026年AI大模型-InstantID:高保真人像风格化的秒级生成-新版课件.pptx
- 2026年AI大模型-RAG 的开放性及企业如何落地-新版课件.pptx
- 2026年AI大模型-大模型赋能数据治理方案-新版课件.pptx
- 2026年-AIGC赋能职业教育教学创变与探索-AI应用.pptx
- 2026年-AIGC行业深度报告ChatGPT:存算一体,算力的下一极-AI应用.pptx
- 2026年-AIGC行业深度报告Sora算力倍增,国产架构+生态崛起-AI应用.pptx
- 2026年-AIGC行业深度报告存算一体算力的下一极-AI应用.pptx
- 2026年-AI大模型研究框架-AI应用.pptx
- 广西南宁市第二中学2025-2026学年八年级下学期开学收心自测英语试卷(含解析).docx
- 广西南宁市武鸣区武鸣高级中学等校2026年高考模拟信息卷数学试题(含解析).docx
- 广西壮族自治区崇左市江州区2025-2026学年八年级上学期期末语文试题(含解析).docx
- 广西壮族自治区防城港市防城区2025—2026学年八年级上学期期末地理试题(含解析).docx
- 部编版一年级下册语文第五单元培优卷A卷(含答案).docx
- 福建省厦门海沧实验中学2025-2026学年高二上学期期末地理试题(含解析).docx
- 甘肃省天水市甘谷县模范初级中学2025-2026学年九年级数学下学期第一次检测考试试题(含解析).docx
- 甘肃省武威市凉州区爱华育新学校2025-2026学年九年级上学期12月月考英语试题(解析版).docx
- 甘肃张掖市2025--2026学年下学期九年级数学阶段反馈试卷(含解析).docx
- 广东惠州博罗县2025-2026学年九年级上学期阶段诊断历史试卷(含解析).docx
原创力文档

文档评论(0)