中国工业大模型行业发展研究报告.docx

下载文档

0
0
约6.23千字
约 17页
2024-11-22 发布于宁夏
举报
版权申诉
保障服务

中国工业大模型行业发展研究报告.docx

1、本文档共17页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

中国工业大模型行业发展研究报告

工业大模型伴随着大模型技术的发展，逐渐渗透至工业，处于萌芽阶段。就大模型的本质而言，是由一系列参数化的数学函数组成的计算系统，且是一个概率模型，其工作机制是基于概率和统计推动进行的，而非真正的理解和逻辑推理，因此，当前大模型具有不可解释性和幻觉不可消除等主要特征。就大模型落地工业的情况而言，工业互联网、等工作已经让部分工业企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程，部分场景已经准备好了向基础大模型投喂的“数据原料”，当经过简单数据处理、微调、适配后，可以解决部分垂直细分场景问题，具有落地可行性。就工业大模型的发展进度而言，工业大模型与工业互联网一样，都是要挖掘数据资产的价值，而数据准备的阶段性工作在工业互联网时期大部分已经准备好，故我们预计工业大模型的进程在技术不受限的前提下，可能会快于工业互联网。当然，工业大模型是以大模型技术为驱动，其进程快慢很大程度受限于大模型本身能力的进化。

工业大模型玩家与工业互联网平台玩家重合度高，其成长路径目前也表现出高度相似的特征，但目前市场产品、服务、落地场景都处于探索阶段，大家都在同一起跑线。就参与玩家而言，大模型技术底蕴、行业knowhow、运维资源等方面是各类玩家主要锚定的优势，且都是基于自身优势点，围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。就具体产品形态而言，整体还较为稚嫩，目前大模型的能力更多还是依附于已有产品体系，鲜少有独立的产品出现，未来随着大模型流量入口特性明朗，有望独立成产品。就应用场景而言，当前大模型的不可解释性和幻觉等特性，与工业“0容错”的特性相悖，因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景（如知识问答、辅助设计/代码生成等），而生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展。就发展挑战而言，模型、数据、应用、商业变现是无法避开的话题，且各方相互影响，互利共赢。

大模型落地工业的探索中，还处于非常早期的阶段，供需双方都在尝试，当然，也有很多问题值得探讨与思考。

1）大模型落地工业的竞争要素：基础能力、模型能力、模型应用是主要竞争点，且在不同行业发展阶段，其相对竞争优势有所不同，具体而言：短期主要看大模型技术，长期则主要看模型应用深度。

2）大小模型间的关系：大小模型间不存在替代关系，是并存且是协同融合赋能的关系。

3）工业大模型服务走向平台化：大模型落地工业的服务平台化特征以开始显现，且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。

4）产业数据拉通助力工业大模型能力进化的同时，对大模型落地工业的广度、深度都大有裨益。

一、背景篇-基本概念厘清

当我们在说AI时，在说什么？

AI本质就是一系列参数化的函数所组成的计算系统，并在一定的框架环境下，进行数据计算和参数调优的过程

整体来看，AI通用技术框架主要分为基础层、技术层、应用层三层，不同公司，在整体框架上都保持一致，只不过针对基础层和技术层的部分内容划分，略有区别，但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑，最终达到模型运行并输出结果的目的。具体到不同层级的主要玩家而言：1）基础层和技术层的AI框架和算法/架构上，其玩家比较类似，主要是国内外领先的科技巨头、云厂等参与，如谷歌、Meta、微软、亚马逊、阿里、百度、华为等；2）应用层和技术层的工具组件、通用技术，其玩家更加百花齐放，针对行业、场景、功能等各角度发力，推动AI工具和应用的落地。当前，大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。

大模型是什么？大模型的能力如何获取？

大模型是从海量数据中学习并记住泛知识后，在域内数据+提示数据集的修正下，具备在某类具有相对更准确能力的计算系统，其本质是概率模型

据AndrejKarpathy所言，大模型本质由巨大的参数文件+运行参数的代码文件两大核心组件构成。其中：1）参数文件是通过大量数据训练获得的，代表从数据中提取的有用信息和模式（可称为“知识”），其参数量与对知识的记忆能力，与数据量、数据按照不同说明进行曝光的次数有关。2）代码文件有点类似“大脑”，主要是指导参数文件进行推理和产出，其中，可根据域内数据、提示数据集等进行调参，不断提升模型的准确性。因此，总结来看，大模型能力获得主要有四步：

1）针对大量数据进行预训练，让大模型学习并记住知识；

2）明确大模型能力侧重点，即给一定高质量、针对性强的域内数据集微调，让大模型在某些能力更加突出；

3）通过标注人员对大模型给出的答案进行排序，给予大模型正向反馈；

4）强化学习。以上，也说明大模型的能力不是只要参数量足够大就具备涌现能力，是需要逐项优化才逐步具备某些能力的。需要

您可能关注的文档

文档评论（0）

150****5147 + 关注: 实名认证

内容提供者

二级建造师持证人

分享知识，传播快乐！

咨询Ta 进入空间

领域认证该用户于2024年03月19日上传了二级建造师

1亿VIP精品文档

更多 >

中国工业大模型行业发展研究报告.docx