网站大量收购独家精品文档,联系QQ:2885784924

中国大模型落地应用案例集(2023).docx

中国大模型落地应用案例集(2023).docx

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中国大模型落地应用案例集(2023)

全文共计4673字,预计阅读时间9分钟

来源?|中国信通院华东分院(转载请注明来源)

编辑?|蒲蒲

近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。

作为首部聚焦落地应用的权威研究成果,《案例集》全面展示了大模型前沿技术和发展成果,推动了大模型为代表的人工智能技术赋能社会经济高质量发展。经专家组的多轮评审,共52个各自领域的典型大模型技术落地应用成功入选。

2022年底ChatGPT的横空出世,引爆了国内外大模型的热情,各行各业的创业者已经集结在十字路口蓄势待发。

从国内市场来看,目前人工智能(AI)大模型已经在各行各业“落子不断”。据公开资料不完全统计显示,国内大模型的发展路径是“通用+垂直”两条腿走路,其中垂类大模型落地速度最快。《案例集》显示,有近65%+的AI大模型是垂直大模型。

趋势已然,大模型技术突破代表了AI发展的一个重要里程碑,下面笔者将梳理中国从业者构建的“底层原创技术-中层基础模型-上层行业应用”的大模型图鉴。

PART1

大模型领域中国学者的技术贡献

图注:ResNet的四位作者分别是:何恺明、张祥雨、任少卿、孙剑

2016年,来自微软亚洲研究院的四位学者提出深度残差学习(ResNet),解决了深度网络的梯度传递问题。要知道,2015年之前深度学习最多只能训练20层,ResNet之后,就可以有效地训练超过百层的深度神经网络。

2017年Google发布Transformer,它的出现打稳了AI大模型的“地基”,不仅“颠覆”了自然语言处理(NLP)中的机器翻译任务,而且还提供了一种新的思路来处理图像数据。

中国学者也围绕Transformer做了许多改进和完善,例如微软亚洲研究院联合西安交通大学推出LONGNET,将Transformer的序列长度扩展10亿+;京东探索研究院联合武汉大学提出全球首个面向遥感任务设计的亿级视觉Transformer大模型;阿里达摩院提出新的Transformer结构FMViT,大幅度提升AI模型精度与速度……

在大模型领域细数中国学者贡献,许多原创性贡献来自本土。已故的商汤科技创始人汤晓鸥(缅怀)在2023世界人工智能大会上,发表演讲时表示:在深度学习的大门上,我们按了18次门铃,取得了许多跨时代的突破。其中汤晓鸥提到了上海人工智能实验室领军科学家林达华,他当时设计的计算机视觉开源算法体系OpenMMLab,目前已经成为国际上最具影响力的视觉算法开源体系。值得一提的是,林达华也是书生大模型体系的重要贡献者。

京东探索研究院早在2021年年初就展开了大模型体系(超级深度学习)的建设和基础研究,领导京东建设了中国第一个NVIDIADGXSuperpod天琴alpah-α超算集群。在此基础上,京东探索研究院的织女模型vegav2在2022年登顶SuperGLUE榜首,一举超越同场竞技的谷歌、微软、Meta等业界顶尖企业;2021年研究院开发的大规模视觉模型ViTAE,在ImageNetReal的目标识别和MSCOCO的人体姿态估计等权威榜单上均获得世界第一。

图注:(上)2022年京东探索研究院发表论文《Self-EvolutionLearningforDiscriminativeLanguageModelPretraining》,提出自我进化学习方法,为vegav2大模型的设计提供核心思想;(下)2021年京东探索研究院发表论文《ViTAE:VisionTransformerAdvancedbyExploringIntrinsicInductiveBias》,尝试将CNN和transformer相结合。

因此,国内公司的AI大模型研发虽然比国外公司晚,但是发展却异常地迅速,其内在逻辑便是:本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代,他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。

在OpenAI发布ChatGPT之前,国内的一些企业就已经押注AI大模型技术:例如2021年4月,华为云联合循环智能发布盘古超大规模预训练语言模型,参数规模达1000亿;2021年6月,北京智源人工智能研究院发布了超大规模智能模型“悟道2.0”,参数规模达到1.75万亿;2021年12月,百度推出ERNIE3.0Titan模型,参数规模达2600亿,同期,阿里巴巴达摩院的M6模型参数达到10万亿,将大模型参数直接提升了一个量级。

到2023年,大模型继续火热,国内的AI大模型团队已

文档评论(0)

龚梅 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档