4_大模型AI定义软件新征途.pdfVIP

  • 0
  • 0
  • 约2.08万字
  • 约 104页
  • 2026-02-26 发布于湖北
  • 举报

大模型AI定义软件新征途

刘靖峰

1个人简介

2大模型时代

3人工智能发展主线

4打造垂直领域的大模型

5部署大模型

6大模型应用场景

7展望:大一统大模型

1个人简介

•美国卡内基梅隆大学博士,新加坡国立大学硕士,浙江大学学士

•中组部海外高层次人才国家特聘专家

•先后在美国迈拓,Marvell,LSI担任高级工程师,主任工程师等职务,具有丰富的

软硬件开发,芯片设计,深度学习算法和系统经验

•发表期刊论文60余篇,美国国家专利50余项,中国国家专利30余项

•带领12位博士团队完成科技部创新项目OFDM载波芯片,红外热成像AI处理芯片

•负责Maxtor最后一代Longitudinalrecording和第一代Perpendicularrecording硬

盘读写芯片研发

•神目云AIoTAI视频平台研发

•大模型指导蛋白进行定向变异改良酶的热稳定性

•泰语ThaiGPT大模型打造

2大模型时代

大模型带来的商机

•互联网时代,每个商家需要网站,催生了一批帮商家搭建网站的企业。这个过程花了几十年。

•移动互联网,UGC是核心,每个商家又匆忙在社交媒体占领阵地,催生了一批帮企业做社交媒体,直

播的企业。

•AI年代,各商家对AI的到来产生极大的焦虑,同样会催生一批帮企业搭建AI能力的企业。这个过程也

会持续10-20年,先行者将会享受红利。

什么是大模型?

语言模型是一个词序列概率分布模型。在实际应用中,语言模型可以计算出:

P[“China”|“Shanghaiisacityin”]

NextTokenPrompt

人工智能时代,我们通常训练神经网络来学习这个

词概率分布模型。

用海量的语料库来训练出的神经网络,叫做大语言

模型,简称大模型。

N-gram语言模型

什么是神经网络?

神经网络:全连接网络

OutputLossTarget

Input

HiddenLayer1HiddenLayer2

反向传播梯度消失

梯度爆炸

3人工智能发展主线解决训练中梯度消失/梯度爆炸的问题

全连接网络卷积神经网络循环神经网络

基于注意力机制的编码器-解码器架构

文档评论(0)

1亿VIP精品文档

相关文档