- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大型语言模型
大型语言模型简介
语言模型
•还记得简单的n元语言模型吗
•给单词序列分配概率
•通过对可能的下一个单词进行采样来生成文本
•根据从大量文本中计算出的计数进行训练
•大型语言模型既相似又不同:
•给单词序列分配概率
•通过对可能的下一个单词进行采样来生成文本
•通过学习猜测下一个单词来训练
大型语言模型
•即使只通过预训练来预测单词
•学到很多有用的语言知识
•因为训练了大量的文本
大型语言模型的三种架构
解码器编码器编码器-解码器
GPT,克劳伯特一家,Flan-T5,小声点
德,休伯特
美洲驼
混合的
编码器
品种多!
•流行:掩蔽语言模型(MLMs)
•伯特家族
•通过从两边的周围单词预测单词来训练
•通常被微调(在监督数据上训练)用于分类任
务。
编码器-解码器
•被训练从一个序列映射到另一个序列
•非常受欢迎:
•机器翻译(从一种语言映射到另一种语言)
•语音识别(从声音到文字的映射)
大型语言模型
大型语言模型简介
大型语言模型
大型语言模型:它们能完成什
么任务?
好主意
很多任务都可以变成预测单词的任务!
本次讲座:纯解码器模型
也称为:
•因果LLM
•自回归LLMs
•从左到右线性最小二乘法
•从左到右预测单词
.)由用户下载日期2025
条件生成:根据以前的文本生成文本!
完成文本
全部这
语言建模头
lSoftmaxiii
逻辑——
未编码层UU
A
变压器块…
您可能关注的文档
- 我们的叙事-2025女性品质生活消费报告.pdf
- 连衣裙图案市场趋势&预测.pptx
- 风格单品趋势-都市运动夹克.pptx
- 2024年中国国际收支报告-国家外汇管理局.pptx
- UMU《AI 赋能企业变革—人才先行》白皮书.pptx
- 风格单品趋势-优雅复古伞裙.pptx
- AI 驱动政务热线发展研究报告(2025).pptx
- 2025小红书家生活场景需求洞察白皮书.pptx
- 市住建局党组书记在学习中央八项规定精神理论学习中心组会上研讨发言材料.docx
- 在2025年市直机关DeepSeek应用专题辅导培训会议上的讲话.docx
- 市统计局党组书记在学习中央八项规定精神理论学习中心组会上研讨发言材料.docx
- 市司法局党组书记在学习中央八项规定精神理论学习中心组会上研讨发言材料.docx
- 《下肢骨及关节》课件.ppt
- 《三维模型展开》课件.ppt
- 《东方文化之魂》课件.ppt
- 国家安全 你我同行——2025全民国家安全教育日主题宣教课件.pptx
- 中国石油分公司领导专题学习2025年政府工作报告心得体会.docx
- 市体育局党组副书记在学习中央八项规定精神理论学习中心组会上研讨发言材料.docx
- 市委书记在理论学习中心组会上学习中央八项规定精神研讨发言材料.docx
- 供电公司党委书记专题学习2025年政府工作报告心得体会.docx
文档评论(0)