- 0
- 0
- 约3.06万字
- 约 45页
- 2026-07-05 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119832567A
(43)申请公布日2025.04.15
(21)申请号202411856307.1
(22)申请日2024.12.16
(71)申请人北京百度网讯科技有限公司
地址100085北京市海淀区上地十街10号
百度大厦二层
(72)发明人倪烽陆瑶王冠中吕文玉黄奎刘毅陈泽裕于佃海马艳军王海峰
(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201
专利代理师金星玉
(51)Int.Cl.
G06V30/19(2022.01)
G06V30/41(2022.01)
G06F16/3329(2025.01)
G06F16/334(2025.01)
G06F40/30(2020.01)
权利要求书5页说明书14页附图6页
(54)发明名称
多模态大模型的训练方法、文档理解方法以
及设备
(57)摘要
CN119832567A本公开提供了多模态大模型的训练方法、文档理解方法以及设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、计算机视觉、大模型等技术领域。具体实现方案为:获取训练数据,其中,训练数据包括文档理解任务下的样本文档图像、样本文档图像对应的样本问题和样本问题的样本回答;
您可能关注的文档
- CN119832361A 基于图像风格迁移的广告设计辅助方法及系统 (杭州次元宇宙文化传播有限公司).docx
- CN119832378A 基于Transformer和CNN融合的小病灶分割和特征学习方法 (深圳技术大学).docx
- CN119832388A 一种混料均匀度确定方法及混料均匀度检测系统 (万华化学集团股份有限公司).docx
- CN119832391A 基于可容错目标定位的视觉导航方法、系统及介质 (山东大学).docx
- CN119832391B 基于可容错目标定位的视觉导航方法、系统及介质 (山东大学).docx
- CN119832393A 用于遥感变化检测的噪声标签鲁棒学习方法、系统和设备 (湖南大学).docx
- CN119832394A 数据分流装置、具有该装置的控制系统及其配置方法 (北京图森智途科技有限公司).docx
- CN119832395A 汽车领域can总线数据的图像识别与分析方法及系统 (中汽数据(天津)有限公司).docx
- CN119832406A 基于多尺度特征融合及高校上采样算法的声呐图像水下检测方法及系统 (南京理工大学).docx
- CN119832436A 基于无人机遥感的森林虫害智能监测方法 (深圳恒升应急科技有限公司).docx
原创力文档

文档评论(0)