- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1 ChatGPT简要技术回顾
2 迈向通用性的提示学习 3 从提示学习到指令学习 4 我们的一些探索和实践 5 ChatGPT开放问题思考
报告提纲
2
1 ChatGPT简要技术回顾
2 迈向通用性的提示学习 3 从提示学习到指令学习 4 我们的一些探索和实践 5 ChatGPT开放问题思考
报告提纲
2
• 为何出圈:不再是传统意义的人机对话系统,而是以自然语言为交互 方式的通用语言处理平台
• 技术有突破:基础数据+核心模型+优化算法
• 应用接地气:几乎可以完成所有语言相关的功能
• 效果超预期:相比于先前系统效果产生质的飞跃
• 超出预期的交互体验
• (1) 通用的意图理解能力,(2) 强大的连续对话能力,(3) 智能的交互修正能力, (4) 较强的逻辑推理能力
ChatGPT简要技术回顾
3
方式的通用语言处理平台
• 技术有突破:基础数据+核心模型+优化算法
• 应用接地气:几乎可以完成所有语言相关的功能
• 效果超预期:相比于先前系统效果产生质的飞跃
• 超出预期的交互体验
ChatGPT简要技术回顾
• (1) 通用的意图理解能力,(2) 强大的连续对话能力,(3) 智能的交互修正能力,
(4) 较强的逻辑推理能力
• 为何出圈:不再是传统意义的人机对话系统,而是以自然语言为交互
3
• ChatGPT是以产品思维驱动的重大集成创新成果
• ChatGPT是OpenAI自2018年以来坚持生成式AI 、长期技术积累,量变产 生质变的重大成果,是迈向AGI的阶段性成果
• ChatGPT的集成技术组成
• ChatGPT的基础模型架构生成式解码器GPT来源于Google于2017年提出的 Transformer
• ChatGPT的指令学习技术同样来源于Google于2021年提出的指令学习模型FLAN
• ChatGPT基于人类反馈的强化学习技术来源于OpenAI自己2017年提出的优化算 法PPO和2021年提出的基于人类反馈的自动摘要方法
ChatGPT简要技术回顾
4
ChatGPT核心技术:基础模型
人工智能 是 模拟 拓展 人类 智能 的
ChatGPT基础模型:GPT
5
ChatGPT核心技术:基础模型
人工智能 是 模拟 拓展 人类 智能 的
ChatGPT基础模型:GPT
理论: 0.4
方法: 0.3
技术: 0.2
5
ChatGPT核心技术:基础模型
t
⋯
⋯
⋯ 人工智能 是 模拟 拓展 人类 智能 的
ChatGPT基础模型:GPT
理论: 0.4
方法: 0.3
技术: 0.2
8000的窗口
5
ChatGPT核心技术:基础模型
t
⋯
⋯
⋯ 人工智能 是 模拟 拓展 人类 智能 的
ChatGPT基础模型:GPT
• 表示维度越高,语义表示越好
• 网络层次越深,预测能力越强
• 参数规模越大,模型容量越高
理论: 0.4
方法: 0.3
技术: 0.2
8000的窗口
5
模型
层数
表示维度
参数
GPT (2018)
12
768
1.17亿
GPT-2 (2019)
48
1600
15亿
GPT-3 (2020)
96
12,288
1750亿
ChatGPT核心技术:基础模型
t
⋯
⋯
⋯ 人工智能 是 模拟 拓展 人类 智能 的
ChatGPT基础模型:GPT
• 表示维度越高,语义表示越好
• 网络层次越深,预测能力越强
• 参数规模越大,模型容量越高
理论: 0.4
方法: 0.3
技术: 0.2
8000的窗口
5
模型
层数
表示维度
参数
GPT (2018)
12
768
1.17亿
GPT-2 (2019)
48
1600
文档评论(0)