- 3
- 0
- 约9.12千字
- 约 7页
- 2023-09-16 发布于四川
- 举报
一种参数高效的大规模预训练模型迁移方法,涉及大规模预训练模型。基于Transformer的大规模预训练模型,优化用于建立自注意力机制的提示向量,在注意力模块中插入提示学习逼近模块和经过扩展的自注意力模块,以降低提示学习带来的额外计算开销,提升信息扩散的效率。1)将提示学习逼近模块插入到Transformer模型的注意力机制中,并添加任务关联的分类器;2)在下游任务上进行微调,实现参数高效的大规模预训练模型的迁移。不仅实现更加高效的输入序列间关系建立,同时允许额外的提示向量遵循新的模式建立与输入序
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116757248 A
(43)申请公布日 2023.09.15
(21)申请号 202310758646.5
(22)申请日 2023.06.26
(71)申请人 厦门大学
您可能关注的文档
- DBC文件更新比对方法、装置、电子设备及存储介质.pdf
- 一种桥梁墩柱破碎回收处理装置.pdf
- 一种能实现精准定位的叠合板线管盒及基于其的施工方法.pdf
- 一种用于ECU的程序升级方法、装置及存储介质.pdf
- 考虑可分割柔性工序的同步流水线调度方法.pdf
- 一种输电塔装配式护壁人工挖孔桩施工方法.pdf
- 一种足疗装置及其控制系统.pdf
- 一种天幕系统、车辆及确定观测位置的方法.pdf
- 室外电气控制柜.pdf
- ABO4型稀土铌/钽酸盐LTCC材料及其制备方法.pdf
- 广东省茂名市2025_2026学年高一化学下学期期中测试合格性考试含听力含解析.pdf
- 广东省茂名市2025_2026学年高一生物下学期期中测试选择性考试.pdf
- 黑龙江省依兰县2025_2026学年高三数学上学期10月月考试卷含解析.pdf
- 湖北省2025_2026学年高一化学上学期素养测评含听力含解析.docx
- 安徽省蚌埠市2025_2026学年高一化学下学期5月区域高中合作性教研质量评价试题含解析.pdf
- ESG周报:十五五重磅指引:新型储能装机300GW,源储调节能力提升40%.docx
- 金属与采矿:采矿备忘录|状态终结者.docx
- 海外医疗器械公司经营情况回顾:医疗器械MNC如何看待中国市场?.docx
- 风电板块2026年中期策略:看好下半年业绩、订单、招标三维共振.docx
- 2026年中国宠物品种专用喂养行业绿皮书.docx
最近下载
- 2025年国家开放大学(电大)《固体物理学》期末考试复习题库及答案解析.docx VIP
- 0-3岁婴幼儿保育与教育—穿脱衣照护.ppt VIP
- 2025年山西机关事业单位工人技术等级考试(农艺工·技师)历年参考题库含答案详解(5卷).docx VIP
- 中国暴雨强度公式汇总202012.pdf VIP
- 分布式控制系统(DCS)系列:ABB 800xA_(14).800xA数据管理与历史记录.docx VIP
- 宣贯培训(2026年)《SYT 5841-2011钻井技术经济指标及计算方法》.pptx VIP
- 2026年及未来5年中国长住型酒店市场竞争格局及投资战略规划报告.docx
- 2025版中国慢性乙型肝炎防治指南.pdf VIP
- 船舶结构强度课程设计.docx VIP
- 2025至2030中国健康体检行业市场发展深度分析及前景趋势与产业运行态势及投资规划深度研究报告.docx
原创力文档

文档评论(0)