迎接大模型时代:大模型发展简史及攻略.docx

迎接大模型时代:大模型发展简史及攻略.docx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

迎接大模型时代:大模型发展简史及攻略

0引言

作为人工智能全球顶级专家,陆奇自今年以来,以”大模型带来的变革和机会”为主题,先后在上海、深圳、北京等城市发表了多场演讲,进一步引发了业界对大模

型的关注和思考。

本文基于对陆奇演讲内容的理解,对大模型的划时代意义、发展过程和分类进行了体系化的梳理,希望能帮助读者更全面、准确地认识大模型。同时尝试梳理并回答大模型如何打造,如何评价、如何实现商业变现等问题,希望能给读者一些启

发。

1大模型正在开启一个新的时代

大模型(LLM)狭义上指基于深度学习算法进行训练的自然语言处理(NLP)模型,主要应用于自然语言理解和生成等领域,广义上还包括机器视觉(CV)大模型、多模态大模型和科学计算大模型等。ChatGPT的火爆吸引了全世界对大模型的关注,比尔·盖茨表示,ChatGPT的诞生意义不亚于互联网的出现;陆奇在报告中称

之为“ChatGPT时刻”。

1.1从云时代向大模型时代进化

信息社会先后经历了计算机、互联网、移动互联网和云计算等重要阶段ChatGPT及一大批类似大模型的发展,标志着信息社会进入了大模型主导的新阶段。根据陆奇提出的“信息-模型-行动”系统分析范式框架,计算机、互联网、移动互

联网和云计算这四个标志性技术都是实现了信息获取的边际成本无限趋近零。大模

型热潮标志着新拐点即将到来,社会各界获取模型的总成本将逐渐趋近固定成本,

预示着模型将无处不在,万物都将成为它的载体。

未来,自动化行动将成为新的拐点,人在物理空间内“行动”的代价转向固定,人将与数字化技术构建出一个全新的智能系统,实现信息、模型和行动的无缝衔接。这意味着人不再通过获取信息,利用人脑分析,自己去行动,而是智能系统自动获取低成本信息(数据),利用大模型,形成指令驱动各类系统(包括机器人)采取行动,从而对整个社会产生深远的影响和冲击,各类数字化系统也将基于大模型形

成互联互通。

1.2大模型时代的三大革命性变化

大模型推动弱人工智能向通用人工智能(AGI)跃升。2023年2月,OpenAI在ChatGPT成功的基础上,发布了通用人工智能路线图,建议逐步向AGI普及的世界过渡,让大众、政策制定者和研究机构有时间了解AGI技术带来的改变。谷歌也指出未来数年AGI将会得到普及,各种应用领域中的智能系统将具备与人类认知

能力相持平的智力水平,能够胜任多种复杂任务。

大模型推动生产力从算力向机器智力跃升。生产力的变革是推动人类社会进步的根本动力,从原始社会、农业社会、工业社会到信息社会,背后是人力、畜力、电力到算力的跃升。随着大模型成为新的物种,机器智力将成为新的主流生产力。机器智力是智能算力与人类知识的扩展、集成和融合,大模型是机器智力的载体。随着大模型的不断进化和普及,其将成为经济社会的主流生产工具,重塑经济社会

的生产方式,全面降低生产成本,提升经济效益。

大模型推动数字社会向智能社会跃升。首先是AI特别是AGI产业高度发展,带动智能算力相关基础设施投资,并基于大模型衍生出多种新业态和新市场,成为经济增长的核心引擎。以智算中心为例,一个单位的智算中心投资,可带动AI核心产业增长约2.9-3.4倍、带动相关产业增长约36-42倍。GPT等各种大模型是人工智能时代的“操作系统”,将重构、重写数字化应用。其次是有了AGI的加持,人类的能力和活动范围都将得到大幅提升,进一步从重复性的脑力劳动中解放出来。但是,需要注意到,大模型的普及也会给现有的教育、就业、舆论甚至全球的政治格

局带来冲击,是需要政府和产业界共同研究的问题。

2大模型发展的三个阶段和三次飞跃

大模型发展主要经历了三个阶段,分别是萌芽期、探索沉淀期和迅猛发展期

(如图1所示)。

图1AI大模型发展的三个阶段

2.1萌芽期(1950年-2005年):以CNN为代表的传统神经网

络模型阶段

1956年,从计算机专家约翰·麦卡锡提出“人工智能”概念开始,AI发展由最开

始基于小规模专家知识逐步发展为基于机器学习。1980年,卷积神经网络的雏形

CNN诞生。1998年,现代卷积神经网络的基本结构LeNet-5诞生,机器学习方法由早期基于浅层机器学习的模型,变为了基于深度学习的模型,为自然语言生成、

计算机视觉等领域的深入研究奠定了基础,对后续深度学习框架的迭代及大模型发

展具有开创性的意义。

2.2探索沉淀期(2006年-2019年):以Transformer为代表

的全新神经网络模型阶段

2013年,自然语言处理模型Word2Vec诞生,首次提出将单词转换为向量的“词向

文档评论(0)

阿弥陀佛 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档