- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大型语言模型
大型语言模型简介
语言模型
•还记得简单的n元语言模型吗
•给单词序列分配概率
•通过对可能的下一个单词进行采样来生成文本
•根据从大量文本中计算出的计数进行训练
•大型语言模型既相似又不同:
•给单词序列分配概率
•通过对可能的下一个单词进行采样来生成文本
•通过学习猜测下一个单词来训练
大型语言模型
•即使只通过预训练来预测单词
•学到很多有用的语言知识
•因为训练了大量的文本
大型语言模型的三种架构
解码器编码器编码器-解码器
GPT,克劳伯特一家,Flan-T5,小声点
德,休伯特
美洲驼
混合的
编码器
品种多!
•流行:掩蔽语言模型(MLMs)
•伯特家族
•通过从两边的周围单词预测单词来训练
•通常被微调(在监督数据上训练)用于分类任
务。
编码器-解码器
•被训练从一个序列映射到另一个序列
•非常受欢迎:
•机器翻译(从一种语言映射到另一种语言)
•语音识别(从声音到文字的映射)
大型语言模型
大型语言模型简介
大型语言模型
大型语言模型:它们能完成什
么任务?
好主意
很多任务都可以变成预测单词的任务!
本次讲座:纯解码器模型
也称为:
•因果LLM
•自回归LLMs
•从左到右线性最小二乘法
•从左到右预测单词
条件生成:根据以前的文本生成文本!
完成文本
全部这
语言建模头
Softmax
逻辑
未编码层U
U
变压器块……
编码器
+我+我+我+我+我+我+我
EEEEEEE
因此长的和谢谢为全部这
前缀文本
很多实际的NLP任务都可以铸为单词预测!
情感分析:《我喜欢成龙》
1.我们给语言模型这个字符串:“我喜欢成
龙”这句话的情绪是:
2.看看它认为下一个单词是什么:
p(正|句子‘我喜欢成龙’的情绪是:)
p(负|句子‘我喜欢成龙’的情绪是:)
将大量任务框架化为条件生成
问答:“物种起源是谁写的”
1.我们给语言模型这个字符串:
问:谁写了《物种起源》这本书?
您可能关注的文档
最近下载
- 平安丝路网第二十二期“一带一路”建设安全保障线上培训自测题.doc VIP
- 《热管基础知识》行业资料能源与动力工程.docx VIP
- (3)施工现场平面布置和临时设施、临时道路布置.doc VIP
- 新型干法2500t-d水泥生产线安全专篇(同安全设施设计专篇)甲级设计院资质.doc
- 小公司组织架构图及部门职责(3篇).pdf VIP
- 小英雄雨来演讲故事朗诵ppt课件(图文).pptx
- 2024商务星球版中考地理复习知识要点提纲.pdf VIP
- Unit1 要掌握的英语单词 讲义--人教版高中英语必修第三册.docx
- JZ-22-01A__美的大多联技术手册 (定稿).pdf
- 2022年新高考英语复习模块一模拟检测—(原卷).doc VIP
文档评论(0)