- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、行业变化
Microsoft:DeepSpeed chat 实现 RLHF 训练加速
2023 年 4 月 13 日,微软发布 DeepSpeed-Chat,使 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用,并使 RLHF 训练真正普及到 AI 社区,其具有以下核心功能:(i)简化 ChatGPT 类型模型的训练和强化推理体验。(ii)加入 DeepSpeed-RLHF 模块。(iii)加入 DeepSpeed-RLHF 系统。
图表1: DeepSpeed-chat 大幅降低第三阶段 RHLF 时延图表2: RHLF 的可扩展性测试
资料来源:Github, 资料来源:Github,
DeepSpeed Chat 模型具有高效性和经济性:DeepSpeed-HE 比现有系统快 15 倍以上,使 RLHF 训练快速且经济实惠。例如,DeepSpeed-HE 在 Azure 云上只需 9 小时即可训练一个 OPT-13B 模型,只需 18 小时即可训练一个 OPT-30B 模型。这两种训练分别花费不到 300 美元和 600 美元。
图表3: DeepSpeed Chat 训练费用及时间较少
资料来源:Github,
DeepSpeed Chat 拥有卓越的扩展性:DeepSpeed-HE 能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。因此,即使是一个拥有 130 亿参数的模型,也只需 1.25 小时就能完成训练。而对于拥有 1750 亿参数的庞大模型,使用 DeepSpeed-HE 进行训练也只需不到一天的时间。
图表4: DeepSpeed Chat 支持多种参数模型
资料来源:Github,
DeepSpeed Chat 可实现 RLHF 训练的普及化:仅凭单个 GPU,DeepSpeed-HE 就能支持训练超过 130 亿 参数的模型。这使得那些无法使用多 GPU 系统的数据科学家和研究者不仅能够轻松创建轻量级的 RLHF 模型,还能创建大型且功能强大的模型,以应对不同的使用场景。
图表5: DeepSpeed Chat 支持大模型训练
资料来源:Github,
DeepSpeed Chat 预计将显著提升 LLM 的人机对话表现。DeepSpeed Chat 助力 LLM 使用 RLHF 进行预训练,使用该工具预训练后的模型性能表现较为出色。以 ColossalChat 为例,ColossalChat 基于 LLaMA 模型,并使用基于人工反馈的强化学习后训练出来的模型,包括完整的 RLHF 过程来复刻类似 ChatGPT 优化训练过程。 ColossalChat 的双语数据集包括 10 万个中英文问答对,该数据集是从社交媒体平台上的真实问题场景中收集和清理得到的。在经过 RLHF 微调训练后,ColossalChat 只需要不到 100 亿个参数就可以达到与ChatGPT 和GPT-3.5相当的效果。
图表6: ColossalChat 数据集收集流程 图表7: ColossalChat 模型表现
资料来源:ColossalChat, 资料来源:ColossalChat,
OpenAITorantulino:AutoGPT 引发 AI 代理热潮
AutoGPT 是一个基于 GPT-4 语言模型的、实验性的开源应用程序,可以根据用户给定的目标,自动生成所需的提示,并执行多步骤的项目,无需人类的干预和指导。该程序可接入互联网并完全独立地在电脑上执行操作,无需在每一步都进行人工提示。并且,AutoGPT 具有多个全新特征,包括接入互联网进行信息搜集、长期和短期内存管理、基于 GPT-4 生成文本、可访问流行的网站和平台,以及使用 GPT-3.5 进行文件储存和汇总等。
AutoGPT 借助 GTP-4 及互联网接口,拥有优秀的内容生成能力。在给定目标下,AutoGPT 基于 GPT-4 制定问题解决方案,后对互联网上搜集的信息内容进行真实性评估,在一系列筛选、评估、更新迭代后,即可汇总完成任务。由 AutoGPT 生成的文本结构清晰、信息全面、逻辑通顺。
行业动态
图表8: AutoGPT 制定任务计划 图表9: AutoGPT 内容生成
资料来源:AutoGPT, 资料来源:AutoGPT,
AutoGPT 作为一个拥有长短期记忆的人工智能体,有多个应用场景,包括内容生成、网站创建及维护、市场研究和分析、营销以及聊天机器人开发等需要持续更新的任务。随着 AutoGPT 的不断更新和升级,其将在市场营销、金融、医疗健康、电子商务等领域有着更广泛的应用
您可能关注的文档
- 2022年报&2023一季报深度复盘.docx
- 2022年报与2023年一季报财务分析.docx
- 2022年公募基金年报持仓透视出哪些重要信息.docx
- 2022年年报综述暨2023年年度展望更新.docx
- 2022私募基金年度报告.docx
- 2023Q1公募基金转债持仓分析.docx
- 2023Q1基金重仓股简析.docx
- 2023Q1基金重仓信用债分析.docx
- 2023Q1主动偏股型公募基金季度报告点评.docx
- 2023年3月经济数据点评:一季度经济超预期的三层含义.docx
- 工会代表大会运行规则及十大制度解读.docx
- 法院合同法案例分析与学习笔记.docx
- 医疗急救口头医嘱管理流程制度.docx
- 幼儿园科学实验教学设计案例.docx
- 2025秋九年级英语全册Unit2Ithinkthatmooncakesaredelicious课时3SectionAGrammarFocus_4c习题课件新版人教新目标版.pptx
- 2025秋九年级英语全册Unit5WhataretheshirtsmadeofSectionA合作探究二课件新版人教新目标版.pptx
- 2025秋九年级英语全册Unit2Ithinkthatmooncakesaredelicious课时4SectionB1a_1d习题课件新版人教新目标版.pptx
- 2025秋九年级英语全册Unit1Howcanwebecomegoodlearners课时3SectionAGrammarFocus_4c习题课件新版人教新目标版.pptx
- 2025秋九年级英语全册Unit5Whataretheshirtsmadeof课时4SectionB1a_1e课件新版人教新目标版.pptx
- 2025秋九年级英语全册Unit3Couldyoupleasetellmewheretherestroomsare课时3SectionAGrammarFocus_4c课件新版人教新目标版.pptx
最近下载
- 民政政策培训课件模板.pptx
- GB∕T 2997-2015 致密定形耐火制品体积密度,显气孔率和真气孔率试验方法.pdf
- 2025德宏州事业单位考试招聘随军家属(6人)笔试备考试题及答案解析.docx VIP
- 招聘简章模版PDF打印版.pdf VIP
- DO-254A硬件适航标准.pdf VIP
- ISO45001内审资料(通知、计划、检查表、不符合).doc VIP
- 2025年医院财务会计人员考试试卷及答案.docx VIP
- 大学《逻辑学》期末复习习题集及考试真题解析.docx VIP
- 考研英语高频单词汇总(提分纯干货)(OCR).pdf VIP
- 基于端口电压积分与变下垂系数的逆变器并联下垂控制策略.pdf VIP
原创力文档


文档评论(0)