第6章大模型原理及应用.pptxVIP

下载本文档

0
0
约3.54千字
约 36页
2025-12-12 发布于陕西
举报
版权申诉

第6章大模型原理及应用.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第6章

大模型原理及应用中国石油大学出版社

CONTENTS目录01什么是大模型02大模型的原理03大模型的应用04应用实践

什么是大模型01

大模型的定义狭义定义狭义上指大语言模型，是目前应用广泛的大模型，如DeepSeek、ChatGPT等。广义定义广义指具有大规模参数和复杂结构的机器学习模型，由深度神经网络构建。大模型类型除语言大模型，还有视觉、多模态、基础大模型等多种类型。

大模型的发展历史01萌芽阶段（20世纪90年代）人工智能初创期，基于数据驱动的机器学习模型因性能局限，表现不佳。02早期探索阶段（2000-2014年）神经网络和深度学习概念建立推广，为后续突破奠定理论基础。03飞速发展阶段（2015-2021年）数据与硬件性能提升，大规模预训练模型成重要发展方向。04全面应用和持续发展阶段（2022年至今）2022年ChatGPT引爆互联网，众多生成式语言大模型涌现。

大模型的特点规模庞大拥有数十亿甚至千亿级别参数，需海量数据与大规模算力支撑。涌现能力数据和参数达临界规模后，展现出小模型不具备的复杂能力。生成能力强在自然语言、图像生成等任务中，能生成高质量相关内容。通用性和灵活性兼顾可广泛应用于自然语言处理、计算机视觉等多领域。迁移学习和预训练先大规模预训练，再针对特定场景微调，提升特定领域性能。

大模型的原理02

大模型的关键技术神经网络（NeuralNetwork，NN）神经网络类似“仿生学”，由“神经元”与“连接”构成，模拟大脑运作，深度足够时成为深度神经网络。注意力机制（AttentionMechanism）模拟人类注意力，让模型聚焦重要信息，Transformer架构是其经典应用，如ChatGPT便采用该架构。卷积神经网络（ConvolutionalNeuralNetwork）擅长处理二维数据局部特征，如在图像识别领域，能通过局部特征识别物体，像识别猫。

大模型的训练大语言模型的训练过程先准备海量文本数据，让模型学习文字、词语含义，通过分词理解句子，据此生成答案。图像识别大模型的训练过程收集海量图片并打标，如收集猫的图片标注特征，模型学习后依特征匹配识别物体。训练过程的复杂性与算力需求实际大模型训练复杂，需预训练、微调、评估等步骤，依赖大量工业级显卡提供算力。

大模型的应用03

大语言模型01典型代表大语言模型典型代表有DeepSeek、ChatGPT等，它们在自然语言处理领域表现出色。02应用方式-回答问题用户输入问题，如“如何提高写作技巧”，大语言模型能给出针对性解答。03应用方式-生成文案输入特定要求，像“写一篇旅游推广文案”，模型可快速生成相关文案。04应用效果展示以生成故事为例，输入指令，模型生成的故事结构清晰、情节丰富，效果良好。

文生图大模型功能概述文生图大模型能依据输入文字，快速生成相应图像，满足多样创作需求。输入示例1-风格描述输入“生成中国水墨画风格，独钓寒江雪图像”，模型据此生成对应风格图片。输入示例2-文学形象输入“根据《三体》内容生成章北海形象”，模型给出符合描述的人物形象图。输出结果展示展示上述输入对应的输出图片，可见模型生成图像与文字描述契合度高。

提示工程概念阐释提示工程指精心设计输入给模型的提示，引导其生成符合需求的输出内容。提示词要素-角色给模型定义角色，如“你是大学教师”，让模型输出更具专业性。提示词要素-指示等指示明确任务，上下文提供背景，例子作操作参考，输入输出规范内容。对比样例展示对比直接提问与用提示工程提问，可见后者生成内容更符合预期。

应用实践04

大语言模型应用故事生成操作在DeepSeek输入框输入“编写中国风格猎人与狗童话”，它会快速生成故事，每次回答不同。文章总结操作输入一段文本，DeepSeek能总结要点，可自行选文字或文章让其总结，辅助提炼关键信息。

文生图大模型应用即梦AI平台介绍即梦AI需注册使用，有文生图、视频及音乐生成功能，平台界面可能随技术迭代变化。复杂文本生成图片过程在即梦AI输入复杂文本，因算力限制，生成图片时间从几秒到几十秒不等，效果独特。多模型综合使用优势本样例用DeepSeek生成提示词，再用即梦AI生成图，多模型结合可更好完成任务。

大模型生成PPT用DeepSeek生成大纲进入DeepSeek输入PPT大纲需求，生成的大纲可依具体内容调整，奠定PPT框架。KIMI+AiPPT生成内容将DeepSeek生成的大纲复制到KIMI+AiPPT对话框，发送后生成丰富PPT内容。选择模板与生成PPT在KIMI+AiPPT选PPT模板，单击“生成PPT”按钮，等待渲染后可下载修改。

大模型的局限性非万能工具大模型基于已知知识

您可能关注的文档

文档评论（0）

zs521 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第6章大模型原理及应用.pptxVIP