- 0
- 0
- 约2.08万字
- 约 104页
- 2026-02-26 发布于湖北
- 举报
大模型AI定义软件新征途
刘靖峰
1个人简介
2大模型时代
3人工智能发展主线
4打造垂直领域的大模型
5部署大模型
6大模型应用场景
7展望:大一统大模型
1个人简介
•美国卡内基梅隆大学博士,新加坡国立大学硕士,浙江大学学士
•中组部海外高层次人才国家特聘专家
•先后在美国迈拓,Marvell,LSI担任高级工程师,主任工程师等职务,具有丰富的
软硬件开发,芯片设计,深度学习算法和系统经验
•发表期刊论文60余篇,美国国家专利50余项,中国国家专利30余项
•带领12位博士团队完成科技部创新项目OFDM载波芯片,红外热成像AI处理芯片
•负责Maxtor最后一代Longitudinalrecording和第一代Perpendicularrecording硬
盘读写芯片研发
•神目云AIoTAI视频平台研发
•大模型指导蛋白进行定向变异改良酶的热稳定性
•泰语ThaiGPT大模型打造
2大模型时代
大模型带来的商机
•互联网时代,每个商家需要网站,催生了一批帮商家搭建网站的企业。这个过程花了几十年。
•移动互联网,UGC是核心,每个商家又匆忙在社交媒体占领阵地,催生了一批帮企业做社交媒体,直
播的企业。
•AI年代,各商家对AI的到来产生极大的焦虑,同样会催生一批帮企业搭建AI能力的企业。这个过程也
会持续10-20年,先行者将会享受红利。
什么是大模型?
语言模型是一个词序列概率分布模型。在实际应用中,语言模型可以计算出:
P[“China”|“Shanghaiisacityin”]
NextTokenPrompt
人工智能时代,我们通常训练神经网络来学习这个
词概率分布模型。
用海量的语料库来训练出的神经网络,叫做大语言
模型,简称大模型。
N-gram语言模型
什么是神经网络?
神经网络:全连接网络
OutputLossTarget
Input
HiddenLayer1HiddenLayer2
反向传播梯度消失
梯度爆炸
3人工智能发展主线解决训练中梯度消失/梯度爆炸的问题
全连接网络卷积神经网络循环神经网络
基于注意力机制的编码器-解码器架构
您可能关注的文档
- 2026年世界经济形势与展望(英)-世界银行-2025-216页.pdf
- 2026中国消费零售市场十大关键趋势-NielsenIQ-2025.12-46页.pdf
- 人力资源数字化成熟度评估工具-北森专属版权.xlsx
- 记忆承载付费文--逆天改命的关键,在于学会如何做自己人生的编剧 已付费.pdf
- 01 芯灵智能制图规范及设计流程.doc
- 03 2022年芯灵智能设计图纸设计培训.pptx
- 04 从0到1 - 智能化设计12.16.doc
- 超级收银员-AIOT平台-接口文档.pdf
- 吉铺_SaaS使用说明.pdf
- 软硬件问题排查_处理方法.pdf
- 宣贯培训(2026年)《NYT 4512-2025 非洲菊疫病抗性鉴定技术规程》.pptx
- 宣贯培训(2026年)《NYT 4514-2025木薯副产物综合利用导则》.pptx
- 宣贯培训(2026年)《NYT 4513-2025木薯全程机械化生产技术规范》.pptx
- 宣贯培训(2026年)《NYT 4470-2025全株玉米青贮质量分级》.pptx
- 宣贯培训(2026年)《NYT 4468-2025玉米供需平衡表编制规范》.pptx
- 宣贯培训(2026年)《NYT 4469-2025全株玉米青贮质量评定 综合指数法》.pptx
- 宣贯培训(2026年)《NYT 4474-2025东北地区玉米-大豆轮作生产技术规程》.pptx
- 宣贯培训(2026年)《NYT 4472-2025玉米耐盐碱鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4473-2025玉米抗旱性鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4478-2025甘薯收获技术规程》.pptx
原创力文档

文档评论(0)