第6章 大模型原理及应用.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第6章

大模型原理及应用中国石油大学出版社

CONTENTS目录01什么是大模型02大模型的原理03大模型的应用04应用实践

什么是大模型01

大模型的定义狭义定义狭义上指大语言模型,是目前应用广泛的大模型,如DeepSeek、ChatGPT等。广义定义广义指具有大规模参数和复杂结构的机器学习模型,由深度神经网络构建。大模型类型除语言大模型,还有视觉、多模态、基础大模型等多种类型。

大模型的发展历史01萌芽阶段(20世纪90年代)人工智能初创期,基于数据驱动的机器学习模型因性能局限,表现不佳。02早期探索阶段(2000-2014年)神经网络和深度学习概念建立推广,为后续突破奠定理论基础。03飞速发展阶段(2015-2021年)数据与硬件性能提升,大规模预训练模型成重要发展方向。04全面应用和持续发展阶段(2022年至今)2022年ChatGPT引爆互联网,众多生成式语言大模型涌现。

大模型的特点规模庞大拥有数十亿甚至千亿级别参数,需海量数据与大规模算力支撑。涌现能力数据和参数达临界规模后,展现出小模型不具备的复杂能力。生成能力强在自然语言、图像生成等任务中,能生成高质量相关内容。通用性和灵活性兼顾可广泛应用于自然语言处理、计算机视觉等多领域。迁移学习和预训练先大规模预训练,再针对特定场景微调,提升特定领域性能。

大模型的原理02

大模型的关键技术神经网络(NeuralNetwork,NN)神经网络类似“仿生学”,由“神经元”与“连接”构成,模拟大脑运作,深度足够时成为深度神经网络。注意力机制(AttentionMechanism)模拟人类注意力,让模型聚焦重要信息,Transformer架构是其经典应用,如ChatGPT便采用该架构。卷积神经网络(ConvolutionalNeuralNetwork)擅长处理二维数据局部特征,如在图像识别领域,能通过局部特征识别物体,像识别猫。

大模型的训练大语言模型的训练过程先准备海量文本数据,让模型学习文字、词语含义,通过分词理解句子,据此生成答案。图像识别大模型的训练过程收集海量图片并打标,如收集猫的图片标注特征,模型学习后依特征匹配识别物体。训练过程的复杂性与算力需求实际大模型训练复杂,需预训练、微调、评估等步骤,依赖大量工业级显卡提供算力。

大模型的应用03

大语言模型01典型代表大语言模型典型代表有DeepSeek、ChatGPT等,它们在自然语言处理领域表现出色。02应用方式-回答问题用户输入问题,如“如何提高写作技巧”,大语言模型能给出针对性解答。03应用方式-生成文案输入特定要求,像“写一篇旅游推广文案”,模型可快速生成相关文案。04应用效果展示以生成故事为例,输入指令,模型生成的故事结构清晰、情节丰富,效果良好。

文生图大模型功能概述文生图大模型能依据输入文字,快速生成相应图像,满足多样创作需求。输入示例1-风格描述输入“生成中国水墨画风格,独钓寒江雪图像”,模型据此生成对应风格图片。输入示例2-文学形象输入“根据《三体》内容生成章北海形象”,模型给出符合描述的人物形象图。输出结果展示展示上述输入对应的输出图片,可见模型生成图像与文字描述契合度高。

提示工程概念阐释提示工程指精心设计输入给模型的提示,引导其生成符合需求的输出内容。提示词要素-角色给模型定义角色,如“你是大学教师”,让模型输出更具专业性。提示词要素-指示等指示明确任务,上下文提供背景,例子作操作参考,输入输出规范内容。对比样例展示对比直接提问与用提示工程提问,可见后者生成内容更符合预期。

应用实践04

大语言模型应用故事生成操作在DeepSeek输入框输入“编写中国风格猎人与狗童话”,它会快速生成故事,每次回答不同。文章总结操作输入一段文本,DeepSeek能总结要点,可自行选文字或文章让其总结,辅助提炼关键信息。

文生图大模型应用即梦AI平台介绍即梦AI需注册使用,有文生图、视频及音乐生成功能,平台界面可能随技术迭代变化。复杂文本生成图片过程在即梦AI输入复杂文本,因算力限制,生成图片时间从几秒到几十秒不等,效果独特。多模型综合使用优势本样例用DeepSeek生成提示词,再用即梦AI生成图,多模型结合可更好完成任务。

大模型生成PPT用DeepSeek生成大纲进入DeepSeek输入PPT大纲需求,生成的大纲可依具体内容调整,奠定PPT框架。KIMI+AiPPT生成内容将DeepSeek生成的大纲复制到KIMI+AiPPT对话框,发送后生成丰富PPT内容。选择模板与生成PPT在KIMI+AiPPT选PPT模板,单击“生成PPT”按钮,等待渲染后可下载修改。

大模型的局限性非万能工具大模型基于已知知识

文档评论(0)

zs521 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档