AI行业市场前景及投资研究报告:ChatGPT技术、国产化尝试、开源模型.pdfVIP

AI行业市场前景及投资研究报告:ChatGPT技术、国产化尝试、开源模型.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ChatGPT技术、国产化尝 试和开源模型 概览 • 背景 • 1.ChatGPT技术 • 1)技术演进:GPT--InstructGPT--ChatGPT • 2) 存在什么样的问题? • 3)学习三阶段 • 4)数据组织和效果评估 • 2.国产化 • 1)背景与问题 • 2)解决思路 • 3)效果与实践 • 3.开源模型 • 1)中文开源模型 • 2)基于自有数据训练出本地模型 • 3)可能的问题、差距和如何进一步提升效果 背景 • ChatGPT: 通用功能型助手 • 2022年12月5日,OpenAI首席执行官Sam Altman在社交媒体上发文 称,ChatGPT推出五天,已突破100万用户 • AI聊天机器人ChatGPT爆火出圈!微软正洽谈100亿美元增持股份 uWmVqWaU9UlX9ZrQoP6MbP7NmOpPsQtQfQoOrNeRrQrOaQsQqQvPpOsMNZnNoO 背景 为什么这么受欢迎: 1)更好的理解用户意 图与生成能力更好的效果; 2)便利的使用形式 (对话机器人)人人都能使用 ChatGPT技术:模型演进 ChatGPT技术:之前的模型存在什么样的问题? • 对齐 问题 :大模型生成的响应不符合用户意 图 • 原 因:语言模型训练的训练 目标是预测下一个词,而不是按照用 户意 图来生成 • 怎么解决:加入基于人类反馈的强化学习 (RLHF) 参考:InstructGPT, Training language models ChatGPT技术:三步走 to follow instructions with human feedback 1.真实用户输入的监督学习 2.奖励函数,评价模型的生成效果 3.基于人类反馈的强化学习, 生成更符合人类需要的内容 ChatGPT技术:数据组织和效果评估 • 冷启动: • 1)现有系统用户prompt ; • 2)标注相似的prompt ; • 3)标注人员 自己想的prompt • 三部分数据 (77K真实数据): • 1. 基于真实用户prompt 的监督学习数据 • (用户prompt, 模型response,13k) • 2. 用于奖励模型训练的数据 (一个prompt多个response的排序,33k ) • 3. 基于奖励模型使用强化学习进行训练 (用户的prompt, 31k ) ChatGPT技术:数据组织和效果评估 ChatGPT 国产化:背景与问题 • 背景与 问题 : 1、ChatGPT效果虽好,但本身不对 中国大陆服务 2 、本地化 问题 : 可能不能满足国内企业级客户的需求,包括无法提供本地化技术支 持与服务 3 、价格 问题 : 以欧美为主要市场的美元计价国内多数用户可能承受不了。 ChatGPT 国产化:解决思路 • 分步走: • 1)百亿参数的中文模型的预训练; • 2)亿级别任务数据上的监督学习 (Prompt多任务学习); • 3)对话化 • • 再 ,引入奖励模型和RLHF用户反馈的强化学习 ChatGPT国产化:Prompt多任务学习 相关工作: 全中文任务支持零样本学习模型(PromptCLUE) google flan-t5, meta opt-iml

文档评论(0)

anhuixingxing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档