AI领域持续发酵，模型推陈出新、科技巨头棋布错峙.docxVIP

下载本文档

7
0
约2.1万字
约 17页
2023-05-21 发布于北京
举报
版权申诉

AI领域持续发酵，模型推陈出新、科技巨头棋布错峙.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一、行业变化 Microsoft：DeepSpeed chat 实现 RLHF 训练加速 2023 年 4 月 13 日，微软发布 DeepSpeed-Chat，使 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用，并使 RLHF 训练真正普及到 AI 社区，其具有以下核心功能：（i）简化 ChatGPT 类型模型的训练和强化推理体验。（ii）加入 DeepSpeed-RLHF 模块。（iii）加入 DeepSpeed-RLHF 系统。图表1： DeepSpeed-chat 大幅降低第三阶段 RHLF 时延图表2： RHLF 的可扩展性测试资料来源：Github，资料来源：Github， DeepSpeed Chat 模型具有高效性和经济性：DeepSpeed-HE 比现有系统快 15 倍以上，使 RLHF 训练快速且经济实惠。例如，DeepSpeed-HE 在 Azure 云上只需 9 小时即可训练一个 OPT-13B 模型，只需 18 小时即可训练一个 OPT-30B 模型。这两种训练分别花费不到 300 美元和 600 美元。图表3： DeepSpeed Chat 训练费用及时间较少资料来源：Github， DeepSpeed Chat 拥有卓越的扩展性：DeepSpeed-HE 能够支持训练拥有数千亿参数的模型，并在多节点多 GPU 系统上展现出卓越的扩展性。因此，即使是一个拥有 130 亿参数的模型，也只需 1.25 小时就能完成训练。而对于拥有 1750 亿参数的庞大模型，使用 DeepSpeed-HE 进行训练也只需不到一天的时间。图表4： DeepSpeed Chat 支持多种参数模型资料来源：Github， DeepSpeed Chat 可实现 RLHF 训练的普及化：仅凭单个 GPU，DeepSpeed-HE 就能支持训练超过 130 亿参数的模型。这使得那些无法使用多 GPU 系统的数据科学家和研究者不仅能够轻松创建轻量级的 RLHF 模型，还能创建大型且功能强大的模型，以应对不同的使用场景。图表5： DeepSpeed Chat 支持大模型训练资料来源：Github， DeepSpeed Chat 预计将显著提升 LLM 的人机对话表现。DeepSpeed Chat 助力 LLM 使用 RLHF 进行预训练，使用该工具预训练后的模型性能表现较为出色。以 ColossalChat 为例，ColossalChat 基于 LLaMA 模型，并使用基于人工反馈的强化学习后训练出来的模型，包括完整的 RLHF 过程来复刻类似 ChatGPT 优化训练过程。 ColossalChat 的双语数据集包括 10 万个中英文问答对，该数据集是从社交媒体平台上的真实问题场景中收集和清理得到的。在经过 RLHF 微调训练后，ColossalChat 只需要不到 100 亿个参数就可以达到与ChatGPT 和GPT-3.5相当的效果。图表6： ColossalChat 数据集收集流程图表7： ColossalChat 模型表现资料来源：ColossalChat，资料来源：ColossalChat， OpenAITorantulino：AutoGPT 引发 AI 代理热潮 AutoGPT 是一个基于 GPT-4 语言模型的、实验性的开源应用程序，可以根据用户给定的目标，自动生成所需的提示，并执行多步骤的项目，无需人类的干预和指导。该程序可接入互联网并完全独立地在电脑上执行操作，无需在每一步都进行人工提示。并且，AutoGPT 具有多个全新特征，包括接入互联网进行信息搜集、长期和短期内存管理、基于 GPT-4 生成文本、可访问流行的网站和平台，以及使用 GPT-3.5 进行文件储存和汇总等。 AutoGPT 借助 GTP-4 及互联网接口，拥有优秀的内容生成能力。在给定目标下，AutoGPT 基于 GPT-4 制定问题解决方案，后对互联网上搜集的信息内容进行真实性评估，在一系列筛选、评估、更新迭代后，即可汇总完成任务。由 AutoGPT 生成的文本结构清晰、信息全面、逻辑通顺。行业动态图表8： AutoGPT 制定任务计划图表9： AutoGPT 内容生成资料来源：AutoGPT，资料来源：AutoGPT， AutoGPT 作为一个拥有长短期记忆的人工智能体，有多个应用场景，包括内容生成、网站创建及维护、市场研究和分析、营销以及聊天机器人开发等需要持续更新的任务。随着 AutoGPT 的不断更新和升级，其将在市场营销、金融、医疗健康、电子商务等领域有着更广泛的应用