扩散语言模型.docxVIP

  • 0
  • 0
  • 约5.87千字
  • 约 76页
  • 2026-02-26 发布于山西
  • 举报

扩散语言模型

叶佳成|香港大学博士

叶佳成

香港大学博士

目前香港大学三年级博士在读,师从于孔令鹏和余涛教授。曾就读于复旦大学FudanNLP实验室师从于张奇教授。在人工智能领域国际顶级会议和期刊(如ICML、NeurIPS、ICLR、ACL、EMNLP、TASLP等)以第一作者身份发表文章十余篇,被引用次数达到1300余次。主要研究包含大语言模型、数据合成和扩散语言模型,主导研发了扩散语言模型Dream7B。

01/扩散语言模型背景介绍

02,基于扩散语言模型的推理规划

03,规模化扩散语言模型

扩散语言模型背景介绍

什么是扩散语言模型?

自回归语言模型

扩散语言模型

JiachengYe,etal.Dream7B.https://hkunlp.github.io/blog/2025/dream

5

为什么扩散语言模型?

速度

MercuryCoder

byInceptionlabs2025.02.27

https://www.inceptionlabs.ai/introducing-mercury

6

为什么扩散语言模型?

速度

Gemini-diffusion

byGoogle2025.05.21

https://deepmind.google/models/gemini-diffusion/

7

为什么扩散语言模型?

推理规划

迭代纠错

全局隐式搜索

8

背景知识–连续扩散模型

后向生成过程

前向加噪过程

https://lilianweng.github.io/posts/2021-07-11-diffusion-models/

9

背景知识–连续扩散模型

后向生成过程

前向加噪过程

po(xr-1lxz)=N(xz-1;ug(xe,t),EO(xe,t))

q(xr-1IXC,xo)=N(xr-1;i,(xe,xo),?I)

10

10

背景知识–连续扩散模型

,

,

.

11

XiangLisaLietalDiffusion-LMImprovesControllableTextGenerationNeurIPS22

背景知识–离散扩散模型

连续扩散模型

离散扩散模型

12

12

背景知识–离散扩散模型

噪声函数:q(atITt-1)=BtTt-1+(1-Bt)qnoise

“Multinomial”

“Absorbing”

qnoise=([M)

JocabAustin,etal.Structureddenoisingdiffusionmodelsindiscretestate-spaces.InNeurIPS,21.

13

13

背景知识–离散扩散模型

训练目标:

“Multinomial”

“Absorbing”

基于扩散语言模型的推理规划

规划任务

规划距离

规划距离(PlanningDistance;PD):为了达到目标位置需要提前多少距离开始规划,用于衡量规划任务的难度

?自回归模型难以执行规划距离大于1的任务

?自回归模型需要更多数据去解决同样规划距离的问题

JiachengYe,

JiachengYe,etal.BeyondAutoregression:DiscreteDiffusionforComplexReasoningandPlanning.InICLR,25.

16

离散扩散模型中的难目标学习

u(xo,x,m;0)=-1xxoTnn

离散扩散模型通过构建多个相关子目标,隐式进行多视角学习

17

17

离散扩散模型在Countdown任务的表现

o(xr.n)=a(1-exp(-u(·)))

18

18

离散扩散模型在Sudoku和SAT任务的表现

SudokuBooleansatisfiabilityproblem(SAT)

19

19

离散扩散模型--隐式搜索?

?———————

?

———————————————

ShunyuYao,etal.TreeofThoughts:DeliberatePro

文档评论(0)

1亿VIP精品文档

相关文档