- 46
- 0
- 约1.08万字
- 约 71页
- 2024-08-22 发布于江苏
- 举报
(2)只对部分参数进行训练,这条路径叫参数高效微调(PEFT)。PEFT主要想解决的是FFT存在的两个主要问题,它是比较主流的微调方案。8.6.1微调技术路线从训练数据的来源以及训练的方法的角度,大模型的微调有以下几条技术路线:(1)监督式微调,用人工标注的数据,通过传统机器学习中监督学习的方法,对大模型进行微调;(2)基于人类反馈的强化学习微调,是把人类的反馈,通过强化学习的方式引入到对大模型的微调中去,让大模型生成的结果更加符合人类的一些期望;8.6.1微调技术路线(3)基于人工智能反馈的强化学习微调,这个方案大致跟基于人类反馈的方案类似,但是反馈的来源是人工智能。这里是想解决反馈系统的效率问题,因为收集人类反馈相对来说成本会比较高、效率比较低。不同的分类角度只是侧重点不一样,对同一个大模型的微调,也不局限于某一个方案,可以多个方案并举。8.6.1微调技术路线提示微调的出发点是基础模型的参数不变,为每个特定任务,训练一个少量参数的小模型,在具体执行特定任务的时候按需调用。其基本原理是在输入序列X之前,增加一些特定长度的特殊词元,以增大生成期望序列的概率。具体来说,就是在Transformer模型环节中,发生在嵌入环节。将大模型比做一个函数,提示微调是在保证函数本身不变的前提下,在X前面加上了一些特定的内容,而这些内容可以影响X生成期望中Y的概率。
您可能关注的文档
- 大语言模型通识 第4章 人工数据标注.ppt
- 大语言模型通识 第5章 大模型预训练数据.ppt
- 大语言模型通识 第6章 大模型的开发组织.ppt
- 大语言模型通识 第7章 分布式训练.ppt
- 大语言模型通识 第9章 强化学习方法.ppt
- 大语言模型通识 第10章 基于大模型的智能体.ppt
- 人教版七年级上册语文精品教学课件 1春第一课时 .ppt
- 部编版一年级下册语文第五单元培优卷A卷(含答案).pdf
- 人教版九年级上册语文精品教学课件 综合性学习 乘着音乐的翅膀 .ppt
- 贵州省贵阳市第一名校2023-2024学年高二下学期物理6月月考试题(含答案).docx
- 广西南宁市第二中学2025-2026学年八年级下学期开学收心自测英语试卷(含解析).docx
- 广西南宁市武鸣区武鸣高级中学等校2026年高考模拟信息卷数学试题(含解析).docx
- 广西壮族自治区崇左市江州区2025-2026学年八年级上学期期末语文试题(含解析).docx
- 广西壮族自治区防城港市防城区2025—2026学年八年级上学期期末地理试题(含解析).docx
- 部编版一年级下册语文第五单元培优卷A卷(含答案).docx
- 福建省厦门海沧实验中学2025-2026学年高二上学期期末地理试题(含解析).docx
- 甘肃省天水市甘谷县模范初级中学2025-2026学年九年级数学下学期第一次检测考试试题(含解析).docx
- 甘肃省武威市凉州区爱华育新学校2025-2026学年九年级上学期12月月考英语试题(解析版).docx
- 甘肃张掖市2025--2026学年下学期九年级数学阶段反馈试卷(含解析).docx
- 广东惠州博罗县2025-2026学年九年级上学期阶段诊断历史试卷(含解析).docx
原创力文档

文档评论(0)