2025年DeepSeek大模型及其企业应用实践报告（企业篇）-厦门大学.docx

下载文档

14
0
约3.67万字
约 150页
2025-03-08 发布于北京
举报
版权申诉
保障服务

2025年DeepSeek大模型及其企业应用实践报告（企业篇）-厦门大学.docx

1、本文档共150页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

DeepSeek

每个人都可以读懂的大模型科普报告（企业篇）

DeepSeek大模型及其企业应用实践

厦门大学林子雨

厦门大学

林子雨副教授

厦门大学大数据教学团队作品2025年3月3日

1.大模型：人工智能的前沿

2.大模型产品

3.大模型的行业应用

4.企业大模型落地方案

5.智能体的企业应用

6.厂商提供的企业级大模型服务

7.大模型典型应用案例

8.AIGC与企业应用实践

9.大模型未来发展趋势

厦门大学大数据教学团队作品

1.大模型：人工智能的前沿

1.1大模型的概念

1.2大模型的发展历程

1.3人工智能与大模型的关系

1.4大模型分类

1.1大模型的概念

大模型通常指的是大规模的人工智能模型，是一种基于深度学习技术，具有海量参数、强大的学习能力和泛化能力，能够处理和生成多种类型数据的人工智能模型。

通常说的大模型的“大”的特点体现在：

参数数量庞大计算资源需求高训练数据量大

参数数量庞大

计算资源需求高

训练数据量大

2020年，OpenAI公司推出了GPT-3，模型参数规模达到了1750亿。

2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上，达到1.8万亿，2021年11月阿里推出的M6模型的参数量达10万亿。

1.1大模型的概念

大模型的设计和训练旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律，具有更强的泛化能力和表达能力

上下文理解能力

大模型具有更强的上下文理解能力，能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答

语言生成能力

大模型可以生成更自然、更流利的语言，减少了生成输出时呈现的错误或令人困惑的问题

学习能力强

大模型可以从大量的数据中学习，并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色

可迁移性高

学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务，无需重新训练

1.2大模型的发展历程

大模型发展历经三个阶段，分别是萌芽期、沉淀期和爆发期

1.2大模型的发展历程

大模型发展对算力的需求演变

1.3人工智能与大模型的关系

人工智能包含了机器学习，机器学习包含了深度学习，深度学习可以采用不同的模型，其中一种模型是预训练模型，预训练模型包含了预训练大模型（可以简称为“大模型”），预训练大模型包含了预训练大语言模型（可以简称为“大语言模型”），预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE，ChatGPT是基于GPT开发的大模型产品，文心一言是基于文心ERNIE开发的大模型产品

深度学习模型预训练模型

深度学习模型

预训练模型

1.4大模型的分类

语言大模型

是指在自然语言处理（NaturalLanguageProcessing，NLP）领域中的一类大模型，通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练，

以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列（OpenAI）、Bard（Google）、DeepSeek、文心一言（百度）等

视觉大模型

是指在计算机视觉（ComputerVision，CV）领域中使用的大模型，通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列（Google）、文心UFO、华为盘古

CV、INTERN（商汤）等

多模态大模型

是指能够处理多种不同类型数据的大模型，例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力，以实现对多模态信息的综合理解和分析，从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库（九章云极DataCanvas）、DALL-E(OpenAI)、悟空画画（华为）、midjourney等

1.4大模型的分类

按照应用领域的不同，大模型主要可以分为L0、L1、L2三个层级

通用大模型L0

是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征

您可能关注的文档

文档评论（0）

哈哈 + 关注: 实名认证

内容提供者

嗨，朋友，我都会用最可爱的语言和最实用的内容，帮助你更好地理解和应对职场中的各种挑战！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2025年DeepSeek大模型及其企业应用实践报告（企业篇）-厦门大学.docx