- 2
- 0
- 约1.19万字
- 约 17页
- 2026-06-11 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119693768A
(43)申请公布日2025.03.25
(21)申请号202411765587.5
(22)申请日2024.12.04
(71)申请人浙江大学
地址310058浙江省杭州市西湖区余杭塘
路866号
(72)发明人梁海极武伯熹林彬彬何晓飞蔡登
(74)专利代理机构杭州天勤知识产权代理有限
公司33224
专利代理师彭剑
(51)Int.Cl.
G06V10/82(2022.01)
G06V10/764(2022.01)
G06V20/70(2022.01)
G06N3/0455(2023.01)
G06N3/08(2023.01)
权利要求书2页说明书6页附图1页
(54)发明名称
一种基于多模态思维链的多模态大语言模
型属性预测方法
(57)摘要
CN119693768A本发明共公开了一种基于多模态思维链的多模态大语言模型属性预测方法,包括:获取多模态大语言模型,与掩码生成器和场景图解析器一起构成多模态属性预测框架;设计分层思维链的推理方法,将属性预测任务输入多模态属性预测框架,提取出属性表的层级,生成分层、格式化的推理提示;将属性预测任务分解成层级化的子任务,并为模型的下一步预测选取提示方法;通过批判性思维监督模型
您可能关注的文档
- CN119693464A 温度补偿模型方法、确定方法、设备及摄像头 (北京字跳网络技术有限公司).docx
- CN119693475A 贴图压缩方法、装置、及计算机可读存储介质 (网易(杭州)网络有限公司).docx
- CN119693476A 图像渲染方法、装置、设备、计算机可读存储介质及产品 (北京字跳网络技术有限公司).docx
- CN119693487A 一种基于扩散模型的图像生成方法、控制器和存储介质 (深圳市城市规划设计研究院股份有限公司).docx
- CN119693488A 低剂量spect图像重建方法及系统 (北京大学第三医院(北京大学第三临床医学院)).docx
- CN119693495A 一种sar图像的彩色化方法、系统、存储介质及设备 (西安电子科技大学).docx
- CN119693496A 一种图像处理方法及装置 (上海汽车集团股份有限公司).docx
- CN119693497A 用于自动生成设计的系统和方法 (坎瓦有限公司).docx
- CN119693505A 一种指令驱动的个性化时尚图像编辑方法 (杭州电子科技大学).docx
- CN119693505B 一种指令驱动的个性化时尚图像编辑方法 (杭州电子科技大学).docx
原创力文档

文档评论(0)