- 0
- 0
- 约1.67万字
- 约 27页
- 2026-01-23 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN117746140B(45)授权公告日2025.01.10
(21)申请号202311772256.X
(22)申请日2023.12.21
(65)同一申请的已公布的文献号申请公布号CN117746140A
(43)申请公布日2024.03.22
(73)专利权人哈尔滨工业大学
地址150001黑龙江省哈尔滨市南岗区西
大直街92号
GO6F18/22(2023.01)GO6V10/82(2022.01)GO6N3/045(2023.01)
(56)对比文件
CN117079024A,2023.11.17CN117011672A,2023.11.07审查员王锡魁
(72)发明人左旺孟黄梓桐陈致兴董伯文
(74)专利代理机构哈尔滨市松花江联合专利商标代理有限公司23213
专利代理师张利明
(51)Int.CI.
GO6V10/764(2022.01)
GO6N3/084(2023.01)权利要求书3页说明书9页附图2页
(54)发明名称
基于提示词微调和特征重放的小样本类增量图像分类方法
(57)摘要
CN117746140B一种基于提示词微调和特征重放的小样本类增量图像分类方法,属于计算机视觉领域中的小样本类增量图像分类领域。本发明针对现有基于纯视觉模型的小样本类增量图像分类方法分类能力差的问题。包括使用可学习提示词和类别名的拼接作为文本编码器的输入,利用图像特征和文本特征的匹配结果,以及真实标签计算交叉熵损失函数来优化可学习提示词;利用上一阶段训练好的提示词来初始化当前阶段的提示词,根据每个类别训练图片的特征,以及VAE输出的合成特征,来估计每个类别特征层面上的高斯分布;在当前阶段使用旧类别的特征高斯分布做虚
CN117746140B
提示词
提示词
文本编码器
图像
编码器
随机选取B
个旧类别
旧类别知识
apple新类财
ear,dog旧类别合成特征
可训临的不可训练的
损失函数
高斯分布
CN117746140B权利要求书1/3页
2
1.一种基于提示词微调和特征重放的小样本类增量图像分类方法,其特征在于包括,
建立CLIP分类模型,采用基类样本对CLIP分类模型进行基阶段训练后得到基类训练后CLIP分类模型,再依次采用不同小样本增量样本库中的增量样本对基类训练后CLIP分类模型进行增量阶段训练,得到增量阶段训练后CLIP分类模型,用于增量后图像分类;
由CLIP分类模型得到基类训练后CLIP分类模型的训练过程包括:
随机初始化获得可学习提示词前缀向量,与基类样本的N个类别向量分别进行拼接,获得N个完整提示文本,经文本编码器得到基阶段N个类别文本特征;
每个基类样本经图像编码器得到基类样本图像编码特征,分别计算每个基类样本图像编码特征与基阶段N个类别文本特征的余弦相似度分数,并结合每个基类样本的标签计算得到当前训练阶段交叉熵损失函数;在基阶段训练过程中,最小化交叉熵损失,利用反向传播算法对可学习提示词前缀向量进行优化,得到基阶段优化后提示词前缀向量;得到基类训练后CLIP分类模型;
由所有基类样本图像编码特征得到N个类别的基类样本特征级高斯分布及对应的基类高斯分布参数;存储N个基类高斯分布参数作为基类类别知识;
再由基类训练后CLIP分类模型得到增量阶段训练后CLIP分类模型的训练过程包括:
将基阶段优化后提示词前缀向量作为当前增量阶段的初始化提示词向量,与当前增量样本与基类样本组成的N1个类别向量分别进行拼接,再经文本编码器得到N1个类别的文本特征;
基于每个增量样本、N1个类别的文本特征和每个增量样本的标签计算得到当前训练阶段交叉熵损失函数;
由基类类别知识的N个基类高斯分布参数中随机采样B个基类高斯分布参数,从中采样基类样本图像编码特征,与对应的基类样本标签计算基类阶段交叉熵损失函数;
由当前训练阶段交叉熵损失函数和基类阶段交叉熵损失函数得到当前阶段最终交叉熵损失函数;在增量阶段练过程中,最小化当前阶段最终交叉熵损失函数,利用反向传播算法对当前阶段初始化提示词向量进行优化,得
您可能关注的文档
- CN114505989B 树脂供给装置、树脂密封装置和树脂密封品的制造方法 (山田尖端科技株式会社).docx
- CN114506347B 一种自动驾驶通过施工路段的系统和方法 (重庆长安汽车股份有限公司).docx
- CN114511714B 物体识别装置和物体识别方法 (株式会社日立制作所).docx
- CN114514236B 含有全氟烷基的核酸及其制造方法 (Agc株式会社).docx
- CN114518846B 数据处理方法及装置 (阿里巴巴(中国)有限公司).docx
- CN114519274B 一种气驱油藏注采参数分步优化方法 (中国石油大学(华东)).docx
- CN114548031B 信号检测方法和装置 (长鑫存储技术有限公司).docx
- CN114559923B 一种无人驾驶车辆自动紧急避障系统及其控制方法 (湖北汽车工业学院).docx
- CN114565528B 一种基于多尺度和注意力机制的遥感影像降噪方法及系统 (中南大学).docx
- CN114580160B 一种用于含裂纹功能梯度板传热问题的非局部方法 (河海大学).docx
最近下载
- 喷墨打印OLED技术全球竞争格局与发展策略.docx VIP
- 深度解析(2026)《GBT 45845.2-2025智慧城市基础设施整合运营框架 第2部分:开发与运维指南》.pptx VIP
- 2025年煤矿安全生产条例、两办意见、硬措施试卷(附答案).docx VIP
- SIMOCODE的参数设置及修改作业指导书.pdf.pdf VIP
- 煤矿两办意见和八项硬措施题(附答案).doc VIP
- 2023-2024学年江苏省南京市玄武区八年级(上)期末物理试卷及答案解析.pdf VIP
- 2022中国慢性自发性荨麻疹患者疾病负担白皮书.pdf VIP
- 雅思阅读:高频文章34 纸张与电脑.pdf VIP
- 2025年修订版《检验检测机构监督管理办法》知识试题库及答案.docx VIP
- 《居家与社区医疗相结合的养老服务规范》DB52T 1891-2025(贵州省标).pdf
原创力文档

文档评论(0)