AI大模型,ChatGPT取得突破性进展,国内大模型争相发布.docxVIP

AI大模型,ChatGPT取得突破性进展,国内大模型争相发布.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大模型概述:大模型提升机器理解能力,优化人机交互 AI 大模型是实现通用人工智能( AGI) 的重要方向 AI 大模型是实现通用人工智能(AGI)的重要方向。AI 大模型是基于海量多源数据打造的模型。AI 大模型具备通用、可规模化复制等诸多优势,是实现 AGI(通用人工智能)的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。 ChatGPT 推出两个月MAU 突破 1 亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。大语言模型(Large Language Model,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在 2022 年 11 月底推出后,2023 年 1 月的月活跃用户数已达 1 亿,成为历史上用户增长最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。 图1:消费级应用达到一亿用户花费时长(月) 图2:ChatGPT 对话演示 资料来源:Yahoo Finance, 整理 资料来源:ChatGPT, 整理 ChatGPT 由OpenAI 研发,GPT 模型已更新至GPT-4,大力出奇迹后出现涌现能力。GPT全称是 Generative Pre-trained Transformer,是OpenAI 开发的一系列延伸自转换器架构(Transformer)的自然语言生成模型。2018 年, OpenAI 推出GPT-1。2022 年 11 月,OpenAI 推出了对话交互式的ChatGPT。ChatGPT 在GPT-3.5 之上用基于人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入,使机器更理解人类语言,让GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力,是模型规模达到量级后“涌现”出的。 图3:ChatGPT 能力实现解析 资料来源:《Natural Language Processing with Deep Learning, Jesse Mu》,艾瑞咨询, 整理 大模型应用:“ 预训练+精调”即可对下游应用赋能,优化人类与机器交互方式 大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。 图4:训练大模型“预训练+精调”模式 资料来源:IDC,百度, 整理 大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。 自然语言类大模型:人类可以用自然语言方式,与机器形成交互。ChatGPT 为自然语言方面的大模型应用,语言文本处理是人类世界最重要的工作内容之一,如果 AI 能 够懂的人类自然语言,并与人类形成交互,将协助人类大幅提升语言文本处理效率,带来生产力效率提升。例如,ChatGPT 可以依托人类自然问答的方式,帮助人类完成回答问题、虚拟助手(计划旅行、预定餐厅、购买产品等)、创作、文本、编程、摘要等工作。 我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。根据微软论文 《Sparks of Artificial General Intelligence: Early experiments with GPT-4》, GPT-4 能够根据人类指令推断出需要哪些工具,有效地解析这些工具的输出并适当地做出回应,而无需任何专门的训练或微调。2023 年 3 月 23 日,OpenAI 宣布推出插件功能,帮助 ChatGPT 访问最新信息、进行计算或使用第三方服务。据 OpenAI 官网,第一批支持ChatGPT 第三方插件的网站共 11 个,包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。 图5:OpenAI 宣布推出插件功能 资料来源:OpenAI 官网, 整理 视觉类大模型:与语言模型类似,视觉类模型需要完成对图片的理解。2023 年 4月 6 日,MetaAI 在官网发布了基础模型Segment Anything Model(SAM)并开源,其本质是基于Transform 模型架构,可以对图像中的一切对象进行分割。交互方面,SAM可使用点击、框选、文字等各种输入提示,指定要在图像中分割的内容。精准分割为大模型图像理解的基础。图像理解可以在智能驾驶、图像识别、安防(人脸识别)等方面进行利用。 图6:Segment Anything Model(SAM)演示 资料来源:Meta, 整理 多模态融合:多模态为语言、图片、音

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档