CN119672342A 一种基于实例感知查询的鲁棒多模态图像分割方法和系统 (中科南京人工智能创新研究院).docxVIP

  • 1
  • 0
  • 约2.85万字
  • 约 38页
  • 2026-06-09 发布于山西
  • 举报

CN119672342A 一种基于实例感知查询的鲁棒多模态图像分割方法和系统 (中科南京人工智能创新研究院).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119672342A

(43)申请公布日2025.03.21

(21)申请号202411807767.5

(22)申请日2024.12.10

(71)申请人中科南京人工智能创新研究院

地址211135江苏省南京市江宁区创研路

266号麒麟人工智能产业园3号楼3楼

(72)发明人何兴建张毅思刘静

(74)专利代理机构北京中先生知识产权代理事务所(普通合伙)16063

专利代理师蔡冬婷

(51)Int.Cl.

G06V10/26(2022.01)

G06V20/70(2022.01)

G06V10/762(2022.01)

G06V10/80(2022.01)

G06F16/583(2019.01)

G06F16/58(2019.01)

权利要求书4页说明书14页附图2页

(54)发明名称

一种基于实例感知查询的鲁棒多模态图像

分割方法和系统

(57)摘要

CN119672342A本发明提供一种基于实例感知查询的鲁棒多模态图像分割方法和系统,方法包括:获取原始图像数据和文本描述数据,通过语义解析和因果图构建生成训练数据;采用多层编码网络提取图像特征和文本特征,通过因果推理建立特征依赖关系;基于注意力计算生成实例聚类特征,结合多尺度融合策略得到

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档