- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
行业专题研究
1. ChatGPT横空出世,多重技术孵化第三代GPT语
言模型
1.1. OpenAI搭建聊天机器人ChatGPT实现多种功能
ChatGPT是由人工智能研究公司OpenAI创建的聊天机蓉人,于2022
年11月首次发布.程序运行遵循对•话形式,能够生成预训练转换器,
星于对方反馈回答后续 题、承认错误、挑战不正确的前提和拒绝不适
当的请求等.聊天机器人可用于回答 题、创建副本、起草论文、调试
代码和生成故事等,并可以在几秒钟内制作出500字的指南•
图1: ChatGPT可根据人的需要创建内容或脚本等
ChatGPT是基于OpenAI “GPT3.5”深度学习语言模型的橄调版本.
ChatGPT使用一种称为“来自人类反馈的强化学习” (RLHF )的方法进
行训练。这意味着用户与程序进行对话时,同时还扮演了 “AI助手”的
角色,其作用是基于实际模型编写建议,然后将新的对话与OpenAI的
InstructGPT数据集混合。最后,该公司通过获取“AI助手”与聊天机
器人的对话,并让“AI助手”对不同的程序反应进行排名,创建奖励模
型,利用类似“人类划重点”、 “强化学习”等更多的思路提升模型效率.
图2: ChatGPT <用RLHF法训练,创立奖励模型以提升其效率
3 of 21
行业专题研究
9Mp3
CoMect demonstration data OpbmUe • policy aoainst the
and tmn a supervised poUq( reward modd using the PPO
rvtnforc«nwnt tearrang l Qorlthrn.
pcon^tts prompt and
您可能关注的文档
- 智慧树答案解析中国茶文化与茶健康知到答案解析见面课章节测试2022年.pdf
- 2022语文课程标准解读与实践:“专题阅读”学习任务群的思考(一年级).pdf
- 走好中国式现代化新道路.pdf
- 第八单元《口语交际 :趣味故事会》大单元教案 三年级语文下册(部编版).pdf
- 2022语文课程标准解读及学习心得:学习任务群的理解与实施.pdf
- 2023年人教版七年级英语下册2单元重点短语词组句型.pdf
- _文学阅读与写作_任务群的理解与实施_郑桂华.pdf
- 2020智慧树,知到《财务报表分析》章节测试完整答案.pdf
- 2023年全国中考英语阅读理解模拟试题汇编四川省广安市.pdf
- ChatGPT知识科普ppt课件-ChatGPT介绍ppt课件.pdf
最近下载
- 2024年智慧树《中华国学》考试题库(含答案).pdf VIP
- 2023年江苏省泰州市中考地理试卷真题(附答案)+2022年地理试卷及答案.docx
- 二年级下册 看图写话 助人为乐.ppt
- GB-50618-2011房屋建筑和市政基础设施工程质量检测技术管理规范.pdf VIP
- 李澄-急性原发性肠脂垂炎CT诊断只是课件.ppt
- 考低压电工证模拟试题(练习题附答案).doc VIP
- 2025高中英语外刊时文阅读 《黑神话:悟空》英文介绍课件.pptx
- DB34T 1589-2012 建筑节能门窗应用技术规程.pdf VIP
- 第四课 共同开发建设祖国 《中华民族大团结》七年级全一册(初中).pptx VIP
- 新审计法党课培训.ppt VIP
文档评论(0)