网站大量收购独家精品文档,联系QQ:2885784924

2025年DeepSeek大模型及其企业应用实践报告(企业篇)-厦门大学.docx

2025年DeepSeek大模型及其企业应用实践报告(企业篇)-厦门大学.docx

  1. 1、本文档共150页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

DeepSeek

每个人都可以读懂的大模型科普报告(企业篇)

DeepSeek大模型及其企业应用实践

厦门大学林子雨

厦门大学

林子雨副教授

厦门大学大数据教学团队作品2025年3月3日

目录

1.大模型:人工智能的前沿

2.大模型产品

3.大模型的行业应用

4.企业大模型落地方案

5.智能体的企业应用

6.厂商提供的企业级大模型服务

7.大模型典型应用案例

8.AIGC与企业应用实践

9.大模型未来发展趋势

厦门大学大数据教学团队作品

1.大模型:人工智能的前沿

1.1大模型的概念

1.2大模型的发展历程

1.3人工智能与大模型的关系

1.4大模型分类

1.1大模型的概念

大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。

通常说的大模型的“大”的特点体现在:

参数数量庞大计算资源需求高训练数据量大

参数数量庞大

计算资源需求高

训练数据量大

2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿。

2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6模型的参数量达10万亿。

1.1大模型的概念

大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力

上下文理解能力

大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答

语言生成能力

大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题

学习能力强

大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色

可迁移性高

学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练

1.2大模型的发展历程

大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期

1.2大模型的发展历程

1.2大模型的发展历程

大模型发展对算力的需求演变

1.3人工智能与大模型的关系

人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品

深度学习模型预训练模型

深度学习模型

预训练模型

1.4大模型的分类

语言大模型

是指在自然语言处理(NaturalLanguageProcessing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,

以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard(Google)、DeepSeek、文心一言(百度)等

视觉大模型

是指在计算机视觉(ComputerVision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古

CV、INTERN(商汤)等

多模态大模型

是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAI)、悟空画画(华为)、midjourney等

1.4大模型的分类

按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级

通用大模型L0

是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征

文档评论(0)

哈哈 + 关注
实名认证
内容提供者

嗨,朋友,我都会用最可爱的语言和最实用的内容,帮助你更好地理解和应对职场中的各种挑战!

1亿VIP精品文档

相关文档