- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中国工业大模型行业发展研究报告
工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有不可解释性和幻觉不可消除等主要特征。就大模型落地工业的情况而言,工业互联网、等工作已经让部分工业企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过简单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。就工业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值,而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。
工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。就参与玩家而言,大模型技术底蕴、行业knowhow、运维资源等方面是各类玩家主要锚定的优势,且都是基于自身优势点,围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。就具体产品形态而言,整体还较为稚嫩,目前大模型的能力更多还是依附于已有产品体系,鲜少有独立的产品出现,未来随着大模型流量入口特性明朗,有望独立成产品。就应用场景而言,当前大模型的不可解释性和幻觉等特性,与工业“0容错”的特性相悖,因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景(如知识问答、辅助设计/代码生成等),而生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展。就发展挑战而言,模型、数据、应用、商业变现是无法避开的话题,且各方相互影响,互利共赢。
大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。
1)大模型落地工业的竞争要素:基础能力、模型能力、模型应用是主要竞争点,且在不同行业发展阶段,其相对竞争优势有所不同,具体而言:短期主要看大模型技术,长期则主要看模型应用深度。
2)大小模型间的关系:大小模型间不存在替代关系,是并存且是协同融合赋能的关系。
3)工业大模型服务走向平台化:大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。
4)产业数据拉通助力工业大模型能力进化的同时,对大模型落地工业的广度、深度都大有裨益。
一、背景篇-基本概念厘清
当我们在说AI时,在说什么?
AI本质就是一系列参数化的函数所组成的计算系统,并在一定的框架环境下,进行数据计算和参数调优的过程
整体来看,AI通用技术框架主要分为基础层、技术层、应用层三层,不同公司,在整体框架上都保持一致,只不过针对基础层和技术层的部分内容划分,略有区别,但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑,最终达到模型运行并输出结果的目的。具体到不同层级的主要玩家而言:1)基础层和技术层的AI框架和算法/架构上,其玩家比较类似,主要是国内外领先的科技巨头、云厂等参与,如谷歌、Meta、微软、亚马逊、阿里、百度、华为等;2)应用层和技术层的工具组件、通用技术,其玩家更加百花齐放,针对行业、场景、功能等各角度发力,推动AI工具和应用的落地。当前,大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。
大模型是什么?大模型的能力如何获取?
大模型是从海量数据中学习并记住泛知识后,在域内数据+提示数据集的修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型
据AndrejKarpathy所言,大模型本质由巨大的参数文件+运行参数的代码文件两大核心组件构成。其中:1)参数文件是通过大量数据训练获得的,代表从数据中提取的有用信息和模式(可称为“知识”),其参数量与对知识的记忆能力,与数据量、数据按照不同说明进行曝光的次数有关。2)代码文件有点类似“大脑”,主要是指导参数文件进行推理和产出,其中,可根据域内数据、提示数据集等进行调参,不断提升模型的准确性。因此,总结来看,大模型能力获得主要有四步:
1)针对大量数据进行预训练,让大模型学习并记住知识;
2)明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;
3)通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;
4)强化学习。以上,也说明大模型的能力不是只要参数量足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。需要
文档评论(0)