PAGE2
语言模型预训练
参考学时
2学时(90分钟)。
教学目标(能力要求)
系统梳理语言模型预训练的基本概念、演变过程及“预训练+微调”与“预训练+提示”范式的基本内容;
学生能深入理解Transformer中自注意力机制(Self-Attention)的查询(Q)、键(K)、值(V)矩阵的作用以及整体的计算过程;
学生能理解BERT与GPT模型的网络结构差异(编码器vs解码器)、训练任务(掩码语言模型vs文本预测)及下游任务应用场景;
学生能基本阐述模型压缩的主要方法,包括知识蒸馏、剪枝、量化的基本内容;
学生能基本阐述大语言模型的指令微调与对齐微调的主要策略;
学生能
您可能关注的文档
最近下载
- DG_TJ08-2046-2024 建设项目(工程)竣工档案编制技术标准.pdf VIP
- 《爆破作业安全管理与地下非煤矿山安全风险辨识》应急局专题课.pptx VIP
- 2026最新部编版小学三年级语文下册期末试卷及答案.docx VIP
- 线性代数 第七版 笔记.docx
- 重大事故隐患的治理情况评估报告2025.6.5(1).doc
- 河南省安阳市殷都区2024-2025学年七年级下学期期末教学质量检测数学试卷(含详解).pdf VIP
- 二年级语文下册25《黄帝的传说》PPT课件.ppt VIP
- 康复医学概论康复医学科的设置和常用设备.pptx VIP
- 2025届四川广元中考语文真题试卷【含答案】.docx
- 对学校结核病督导记录.doc VIP
原创力文档

文档评论(0)