第2章大模型：人工智能的前沿.pptxVIP

下载本文档

2
0
约1.15万字
约 53页
2025-08-20 发布于广东
举报
版权申诉

第2章大模型：人工智能的前沿.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大模型概念、技术与应用实践林子雨副教授厦门大学

主讲教师和作者林子雨简介厦门大学计算机科学与技术系副教授以第一作者编著18本大数据与人工智能教材被国内1000余所高校采用荣获“2022年福建省高等教育教学成果奖特等奖（个人排名第一）”入选“2021年高校计算机专业优秀教师奖励计划”2018年国家精品在线开放课程（独立主讲）2020年国家级线上一流本科课程（独立主讲）2021年国家级线上一流本科课程（独立主讲）入选“2023年教育部国家智慧教育公共服务平台应用典型案例”2025年2月发布4个大模型系列报告，全网浏览量超过1000万

《大模型概念、技术与应用实践》教材《大模型概念、技术与应用实践》林子雨编著人民邮电出版社2025年8月ISBN:978-7-115-67599-6定价：49.80元教材官网提供详细信息和样书申请官网：/post/LLM全书共13章，内容包括人工智能概述、大模型：人工智能的前沿、DeepSeek大模型的应用场景、大模型工具、本地部署大模型、智能体、AIGC的概念与应用、文本类AIGC应用实践、图片类AIGC应用实践、语音类AIGC应用实践、视频类AIGC应用实践、AI搜索、AI智能办公

第2章大模型：人工智能的前沿

目录2.1大模型概述2.2大模型的基本原理2.3大模型的分类2.4大模型的应用领域2.5大模型对人们工作和生活的影响2.6大模型是否可以让人类步入AGI时代

2.1大模型概述

2.1大模型概述大模型的概念大模型与小模型的区别大模型的发展历程

2.1.1大模型的概念大模型通常指的是大规模的人工智能模型，是一种基于深度学习技术，具有海量参数、强大的学习能力和泛化能力，能够处理和生成多种类型数据的人工智能模型通常说的大模型的“大”的特点体现在：参数数量庞大训练数据量大计算资源需求高大模型的优势主要包括以下几个方面：上下文理解能力学习能力强语言生成能力可迁移性高

2.1.2大模型与小模型的区别小模型通常指参数较少、层数较浅的模型，它们具有轻量级、高效率、易于部署等优点，适用于数据量较小、计算资源有限的场景，例如移动端应用、嵌入式设备、物联网等而当模型的训练数据和参数不断扩大，直到达到一定的临界规模后，其表现出了一些未能预测的、更复杂的能力和特性，模型能够从原始训练数据中自动学习并发现新的、更高层次的特征和模式，这种能力被称为“涌现能力”。而具备涌现能力的机器学习模型就被认为是独立意义上的大模型，这也是其和小模型最大意义上的区别相比于小模型，大模型通常参数较多、层数较深，具有更强的表达能力和更高的准确度，但也需要更多的计算资源和时间来训练和推理，适用于数据量较大、计算资源充足的场景，例如云端计算、高性能计算、人工智能等

2.1.3大模型的发展历程

2.2大模型的基本原理

2.2大模型的基本原理原理概述大模型训练的实例演示

2.2.1原理概述在大模型中，文本数据会被切分成一个个有意义的片段，这些片段就被称为Token（或者翻译为“词元”），一个Token可能是一个字符、一个单词或单词的组合等大模型在处理文本数据时，需要将文本转化为计算机能够理解的形式，每个Token会被映射为一个特定的向量表示在生成文本时，模型也是逐个Token地进行输出。模型会根据输入以及已经生成的上下文，预测下一个可能的Token，直到生成完整的文本内容Token的数量可以用来衡量模型处理的文本规模以及计算量。因此，对于一些收费的大模型产品，其收费价格都是以Token以单位

2.2.1原理概述大模型是基于深度学习的，它利用大量的数据和计算资源来训练具有大量参数的神经网络模型泛化能力自注意力机制神经网络训练和优化编码-解码过程数据驱动

2.2.2大模型训练的实例演示厦门大学官网（）里面有一个“学校简介”的网页xxjj.htm（如图所示），这个网页包含了大约2千字的文本内容，下面是网页的第1段文字内容：厦门大学（XiamenUniversity），简称厦大（XMU），由著名爱国华侨领袖陈嘉庚先生于1921年创办，是中国近代教育史上第一所华侨创办的大学，也是一所与中国共产党同龄的大学。在建校100周年之际，中共中央总书记、国家主席、中央军委主席习近平向学校发来贺信。贺信指出，厦门大学是一所具有光荣传统的大学。100年来，学校秉持爱国华侨领袖陈嘉庚先生的立校志向，形成了“爱国、革命、自强、科学”的优良校风，打造了鲜明的办学特色，培养了大批优秀人才，为国家富强、人民幸福和中华文化海外传播作出了积极贡献。

2.2.2大模型训练的实例演示大模型开发者（比如开发DeepSeek的杭州深度求索公司）是如何使用这2000字文本内容对大模型进行训练的呢？这2000字文本内容首先会被切分成一个个To

您可能关注的文档

文档评论（0）

学海无涯而人有崖 + 关注: 实名认证

文档贡献者

教师资格证、人力资源管理师持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年06月11日上传了教师资格证、人力资源管理师

1亿VIP精品文档

更多 >

第2章大模型：人工智能的前沿.pptxVIP