- 1、本文档共150页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek
每个人都可以读懂的大模型科普报告(企业篇)
DeepSeek大模型及其企业应用实践
厦门大学林子雨
厦门大学
林子雨副教授
厦门大学大数据教学团队作品2025年3月3日
目录
1.大模型:人工智能的前沿
2.大模型产品
3.大模型的行业应用
4.企业大模型落地方案
5.智能体的企业应用
6.厂商提供的企业级大模型服务
7.大模型典型应用案例
8.AIGC与企业应用实践
9.大模型未来发展趋势
厦门大学大数据教学团队作品
1.大模型:人工智能的前沿
1.1大模型的概念
1.2大模型的发展历程
1.3人工智能与大模型的关系
1.4大模型分类
1.1大模型的概念
大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。
通常说的大模型的“大”的特点体现在:
参数数量庞大计算资源需求高训练数据量大
参数数量庞大
计算资源需求高
训练数据量大
2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿。
2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6模型的参数量达10万亿。
1.1大模型的概念
大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力
上下文理解能力
大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答
语言生成能力
大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题
学习能力强
大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色
可迁移性高
学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练
1.2大模型的发展历程
大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期
1.2大模型的发展历程
1.2大模型的发展历程
大模型发展对算力的需求演变
1.3人工智能与大模型的关系
人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品
深度学习模型预训练模型
深度学习模型
预训练模型
1.4大模型的分类
语言大模型
是指在自然语言处理(NaturalLanguageProcessing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,
以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard(Google)、DeepSeek、文心一言(百度)等
视觉大模型
是指在计算机视觉(ComputerVision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古
CV、INTERN(商汤)等
多模态大模型
是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAI)、悟空画画(华为)、midjourney等
1.4大模型的分类
按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级
通用大模型L0
是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征
您可能关注的文档
最近下载
- 磷化氢特性及安全措施应急处置原则.docx VIP
- 初中新征程 明确学习目标.pptx VIP
- GB T 21246-2020 埋地钢质管道阴极保护参数测量方法.pdf
- 溃坝计算_原创精品文档.xls VIP
- AP美国政府与政治自测题与解析- AP U.S. Government & Politics 2018 Ed.pdf VIP
- 伤寒论条文 整理.doc
- DB11_T 387.3-2020水利工程施工质量评定 第3部分:引水管线.docx
- 《黄帝内经》白话文通俗版全文.docx
- 2025年江西工业职业技术学院单招职业适应性考试题库新版.docx VIP
- 《劳动合新同法》实施后企业面临的用工风险跟应对(一).ppt
文档评论(0)