AI大模型，ChatGPT取得突破性进展，国内大模型争相发布.docxVIP

下载本文档

11
0
约1.39万字
约 23页
2023-05-21 发布于北京
举报
版权申诉

AI大模型，ChatGPT取得突破性进展，国内大模型争相发布.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大模型概述：大模型提升机器理解能力，优化人机交互 AI 大模型是实现通用人工智能（ AGI）的重要方向 AI 大模型是实现通用人工智能（AGI）的重要方向。AI 大模型是基于海量多源数据打造的模型。AI 大模型具备通用、可规模化复制等诸多优势，是实现 AGI（通用人工智能）的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉（CV）等，统一整合的多模态大模型等。 ChatGPT 推出两个月MAU 突破 1 亿，是自然语言处理领域突破性的创新，进一步理解了人类语言。大语言模型（Large Language Model，LLM）是一种使用了大量数据训练的深度学习算法，构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在 2022 年 11 月底推出后，2023 年 1 月的月活跃用户数已达 1 亿，成为历史上用户增长最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型，可以应对各种自然语言处理任务，包括机器翻译、问答、文本生成等。图1：消费级应用达到一亿用户花费时长(月) 图2：ChatGPT 对话演示资料来源：Yahoo Finance，整理资料来源：ChatGPT，整理 ChatGPT 由OpenAI 研发，GPT 模型已更新至GPT-4，大力出奇迹后出现涌现能力。GPT全称是 Generative Pre-trained Transformer，是OpenAI 开发的一系列延伸自转换器架构（Transformer）的自然语言生成模型。2018 年， OpenAI 推出GPT-1。2022 年 11 月，OpenAI 推出了对话交互式的ChatGPT。ChatGPT 在GPT-3.5 之上用基于人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入，使机器更理解人类语言,让GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力，是模型规模达到量级后“涌现”出的。图3：ChatGPT 能力实现解析资料来源：《Natural Language Processing with Deep Learning， Jesse Mu》，艾瑞咨询，整理大模型应用：“ 预训练+精调”即可对下游应用赋能，优化人类与机器交互方式大模型借助“预训练+精调”等模式，用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下，借助“预训练+精调”等模式，应用模型用相比较大模型更少量的数据即可进行相应微调，高水平完成细分应用的任务。图4：训练大模型“预训练+精调”模式资料来源：IDC，百度，整理大模型增强机器理解力，优化人类与机器交互方式，提升信息处理效率。自然语言类大模型：人类可以用自然语言方式，与机器形成交互。ChatGPT 为自然语言方面的大模型应用，语言文本处理是人类世界最重要的工作内容之一，如果 AI 能够懂的人类自然语言，并与人类形成交互，将协助人类大幅提升语言文本处理效率，带来生产力效率提升。例如，ChatGPT 可以依托人类自然问答的方式，帮助人类完成回答问题、虚拟助手（计划旅行、预定餐厅、购买产品等）、创作、文本、编程、摘要等工作。我们也可以通过语言类大模型调用机器工具，大模型相当于人类助手。根据微软论文《Sparks of Artificial General Intelligence: Early experiments with GPT-4》， GPT-4 能够根据人类指令推断出需要哪些工具，有效地解析这些工具的输出并适当地做出回应，而无需任何专门的训练或微调。2023 年 3 月 23 日，OpenAI 宣布推出插件功能，帮助 ChatGPT 访问最新信息、进行计算或使用第三方服务。据 OpenAI 官网，第一批支持ChatGPT 第三方插件的网站共 11 个，包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。图5：OpenAI 宣布推出插件功能资料来源：OpenAI 官网，整理视觉类大模型：与语言模型类似，视觉类模型需要完成对图片的理解。2023 年 4月 6 日，MetaAI 在官网发布了基础模型Segment Anything Model（SAM）并开源，其本质是基于Transform 模型架构，可以对图像中的一切对象进行分割。交互方面，SAM可使用点击、框选、文字等各种输入提示，指定要在图像中分割的内容。精准分割为大模型图像理解的基础。图像理解可以在智能驾驶、图像识别、安防（人脸识别）等方面进行利用。图6：Segment Anything Model（SAM）演示资料来源：Meta，整理多模态融合：多模态为语言、图片、音