- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120236061A(43)申请公布日2025.07.01
(21)申请号202510301876.8
(22)申请日2025.03.14
(71)申请人东南大学
GO6N3/08(2023.01)
GO6V10/764(2022.01)
地址211189江苏省南京市江宁区东南大
学路2号
(72)发明人路小波程西蒙
(74)专利代理机构南京众联专利代理有限公司
32206
专利代理师叶倩
(51)Int.CI.
GO6V10/25(2022.01)
GO6V10/82(2022.01)
GO6V10/80(2022.01)
GO6V10/74(2022.01)
GO6N3/045(2023.01)
权利要求书2页说明书8页附图2页
(54)发明名称
进行数据采集,在林业监测现场拍摄并获取多模态数据,将所获取的多模态数据集划分为多个子数据集。对所述子数据集进行预处理,应用图像增强技术,
进行数据采集,在林业监测现场拍摄并获取多模态数据,将所
获取的多模态数据集划分为多个子数据集。
对所述子数据集进行预处理,应用图像增强技术,然后进行目标标注,最后去除标注错误或质量低劣的图像。
选择视觉语言预训练目标检测模型作为基础模型,
构建包含自适应专家扩展模块、频域路由器模块以及基于球
面线性插值的权重融合方法的增量混合模型
采用持续学习方法对所述增量混合专家模型框架进行训练,
按顺序引入领域增量任务和类别增量任务,触发自适应专家
扩展模块和频域路由器模块的相应操作。
基于增量混合专家模型的目标检测推理,对
待检测林业图像样本傅里叶变换并查询相似度最高专家,激
活该专家进行图像特征提取,最终模型输出目标检测结果。
(57)摘要
CN120236061A本发明公开了一种基于多模态持续学习的林业场景目标检测方法及系统,包括建立多模态数据集、数据预处理、构建增量混合专家模型、模型训练和目标检测推理五个步骤,通过构建一个增量混合专家模型,结合自适应专家扩展模块、频域路由器模块以及基于球面线性插值的权重融合方法,实现对多模态林业场景目标的高效、准确检测。本发明方法能够在不断引入新任务的过程中,动态生成和调整专家模块,以适应不同领域和类别的目标检测需求,且有效防止灾难性遗忘现象,保持模型对先前任务的稳健
CN120236061A
CN120236061A权利要求书1/2页
2
1.基于多模态持续学习的林业场景目标检测方法,其特征在于,包括如下步骤:
S1、建立多模态数据集:在林业监测现场采集多模态数据,建立多模态数据集,并将数据集根据检测任务划分为多个子数据集;
S2、数据预处理:对步骤S1划分的子数据集进行预处理,所述预处理至少包括图像增强、目标标注及数据清洗;
S3、构建增量混合专家模型:所述增量混合专家模型以视觉语言预训练目标检测模型作为基础模型,至少包括自适应专家扩展模块、频域路由器模块以及基于球面线性插值的权重融合方法,用于支持目标检测任务的持续学习;其中,自适应专家扩展模块动态生成和调整专家模块;频域路由器模块被插入到所有专家模块前,负责任务分类和专家激活;基于球面线性插值的权重融合方法负责新旧专家模块的权重融合;
S4、模型训练:对步骤S3构建的增量混合专家模型进行训练,根据任务类型,通过自适应专家扩展模块动态生成新的专家模块或复制现有专家模块,通过基于球面线性插值的权重融合方法进行权重融合,动态调整专家模块的参数,获得最优模型;
S5、目标检测推理:将待检测样本输入步骤S4获得的最优模型中,频域路由器模块根据输入样本的路由特征,计算其与所有已学习路由特征的相似度,激活相似度最高的专家模块进行目标检测,输出目标检测结果。
2.如权利要求1所述的基于多模态持续学习的林业场景目标检测方法,其特征在于:所述步骤S3的自适应专家扩展模块中,初始专家模块用于处理初始的目标检测任务,
当接收到新的领域增量任务时,动态生成新的专家模块,并将其
您可能关注的文档
- CN120031222B 一种基于多源数字信息的强震区公路减灾选线方法 (四川省公路规划勘察设计研究院有限公司).docx
- CN120031698B 一种用于野城交界域区划的自适应阈值优化方法及系统 (山东大学).docx
- CN120041113B 一种用于硫化物固态电池的聚合物粘结剂及其制备方法、应用 (上海屹锂新能源科技有限公司).docx
- CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通用软件有限公司).docx
- CN120046432B 一种确定非均质土层边坡双临界滑动面的搜索方法 (南京工业大学).docx
- CN120047115B 一种基于有向无环图的合同事件依赖关系建模方法 (点击律(上海)网络科技有限公司).docx
- CN120047776B 基于Retinex-DCE-YOLOv5s的隧道机电设备识别方法及系统 (浙江省交通运输科学研究院).docx
- CN120055498B 一种基于高熵合金中间层扩散连接异质钛合金的方法 (西北工业大学).docx
- CN120063932B 一种泡沫玻璃加工用多工位检测装置及方法 (江苏德和绝热科技有限公司).docx
- CN120064472B 基于声发射信号频域迁移的输送带隐性损伤识别方法 (衡阳腾飞机械有限公司).docx
最近下载
- 中等职业学校运动与休闲专业类《体育教学与实践》课程标准.docx VIP
- HG_T 5959-2021 生化法处理废(污)水用碳源 乙酸钠.docx VIP
- 2025年云南省中考英语真题总评及全面解读 .pdf VIP
- 新解读《GB_T 20322-2023石油及天然气工业 往复压缩机》最新解读.pptx VIP
- 新目标大学英语(第二版)视听说教程 1 参考答案.pdf VIP
- 《大学生创新创业计划书》.pptx VIP
- 地下室混凝土剪力墙裂缝原因分析及防治措施.doc VIP
- 突发停电停水停气应急预案.doc VIP
- PPT课件新修订治安管理处罚法.pptx VIP
- 6SR550 GH180中压变频器操作说明 Gen5 Value System Manual_Chinese Version_AH.pdf VIP
原创力文档


文档评论(0)