- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ChatGPT
林惠文@真格基金
体验ChatGPT
与GPT-3的对比
与GPT-3的对比
与GPT-3的对比
强烈建议体验
https://mirror.xyz/
0x6E1211dfcc20c75440E0B3c10721f5/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc
ChatGPT提升的核心点
?敢于质疑不正确的前提
?主动承认错误和无法回答的问题
?大幅提升了对用户意图的理解
?大幅提升了结果的准确性
提升?类意图的?致性
连续多轮对话能力
提升的原因
加入了基于人类的反馈系统
丛问题库里抽取问题
丛问题库里抽取问题
什么是香蕉?
什么是香蕉?
写期待的回复标记者(Labeler)书
写期待的回复
香蕉是一种水果,从香蕉
香蕉是一种水果,从香蕉
树….
被标记的数据用来调优
GPT-3.5
ReinforcementLearningfromHumanFeedback
什么是香蕉?采样问题,并列出所有模型和标记者的回答
什么是香蕉?
香蕉是芭蕉科、芭蕉属植物
香蕉是芭蕉科、芭
蕉属植物...
香蕉是一种水果,从香蕉树….
香蕉,从属性来
香蕉,从属性来说,与草莓、葡萄、猕猴桃是亲…
香蕉为芭蕉科植物
甘蕉的果实。原产
亚洲东南部…
标记者(Labeler)排
序所有标记着答案
用排序答案训练
奖励模型
通过模型生成初步回答
输入奖励模型得到分数和优化参数
写个水獭的故事
写个水獭的故事
很久很久以前...
很久很久以前...
持续优化参数迭代
往前捋捋
chatGPT
GPT-1GPT-3GPT-2
GPT-1
GPT-3
GPT-2
InstructGPT
2018201920202022
1.17亿参数
15亿参数
1500w美金1750亿参数
再往前捋捋
chatGPT
DecoderGPT-1TransformerGPT-3InstructGPTT5M2m-100BigBirdBERTXLMALBERT
Decoder
GPT-1
Transformer
GPT-3
InstructGPT
T5
M2m-100
BigBird
BERT
XLM
ALBERT
GPT-2
BART
RoBERTa
Encoder
《AttentionisAllYouNe
《AttentionisAllYouNeed》
ELECTRA
GPT-1GPCNN卷积神经网络T5BRNN循环神经网络BERTRoB▲继续再往前捋捋
GPT-1
GP
CNN
卷积神经网络
T5
B
RNN
循环神经网络
BERT
RoB
▲
Transformer
1990开始-2006突破-2015繁荣2017开始
基于规则继续再往前捋捋
基于规则
机器学习
1950开始1980开始
CNN
CNN
卷积神经网络
RNN循环神经网络
RNN
循环神经网络
GPTT5BER▲
GPT
T5
BER
▲
Transformer
1990开始-2006突破2017开始
基于规则发展趋势
基于规则
机器学习
手写规则,简单粗暴只能处理非常少量数据找到一些
手写规则,简单粗暴只能处理非常少量数据
神经网络
像人脑一样学习开始尝试大量数据
Transformer
优化人脑学习过程关注重点而非全部
分类黄豆和绿豆
提前标记一些数据
根据大量数据分类学习一个复杂的参
数集合
发展趋势
神经网络
像人脑一样学习
提前标记一些数据
根据大量数据分类学习一个复杂的参
数集合
Transformer
优化人脑学习过程关注重点而非全部
GPT3
投喂
海量的学习数据
无需分类数据
1200万美金
ChatGPT
人对结果的反馈
成为学习过程的一部分
算法+
算法
+
数据量
既要聪明,又要努力
算法+
算法
+
数据量
ChatGPT:
每走一步都观察人类反馈朝着人类期望的方向进发
脑洞思考
GPT3ChatGPT-?基于人类反馈的训练方法
GPT3
ChatGPT
-?
能否拓展到更多领域?比如情感?
的学习数据的学习过程人对结果的反馈
的学习数据的学习过程
您可能关注的文档
- 【哈尔滨工业大学】ChatGPT调研报告.docx
- 【开源证券】智能汽车系列深度:ChatGPT横空出世,大模型全面赋能,自动驾驶渐行渐近.docx
- 01哈尔滨工业大学:ChatGPT调研报告.docx
- 8.2023ChatGPT对人力资源管理的影响分析报告-法国里昂商学院xHRflag.docx
- 493-ChatGPT过去现在与未来(1)(1).docx
- 2023年 【14页】Chat-GPT主题引发教育板块行情.docx
- 2023年 【15页】人工智能行业:Chat-GPT API开放,AIGC迎来新时代.docx
- 2023年 【17页】Chat-GPT,深度拆解AI算力模型(1).docx
- 2023年 【22页】全球人工智能AI行业专题研究系列:从Chat-GPT看AI技术变革&产业化.docx
- 2023年 【25页】Chat-GPT引领AI加速落地,如何一键布局AI领域核心标的?.docx
文档评论(0)