CN119832567A 多模态大模型的训练方法、文档理解方法以及设备 (北京百度网讯科技有限公司).docxVIP

  • 0
  • 0
  • 约3.06万字
  • 约 45页
  • 2026-07-05 发布于山西
  • 举报

CN119832567A 多模态大模型的训练方法、文档理解方法以及设备 (北京百度网讯科技有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119832567A

(43)申请公布日2025.04.15

(21)申请号202411856307.1

(22)申请日2024.12.16

(71)申请人北京百度网讯科技有限公司

地址100085北京市海淀区上地十街10号

百度大厦二层

(72)发明人倪烽陆瑶王冠中吕文玉黄奎刘毅陈泽裕于佃海马艳军王海峰

(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201

专利代理师金星玉

(51)Int.Cl.

G06V30/19(2022.01)

G06V30/41(2022.01)

G06F16/3329(2025.01)

G06F16/334(2025.01)

G06F40/30(2020.01)

权利要求书5页说明书14页附图6页

(54)发明名称

多模态大模型的训练方法、文档理解方法以

及设备

(57)摘要

CN119832567A本公开提供了多模态大模型的训练方法、文档理解方法以及设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、计算机视觉、大模型等技术领域。具体实现方案为:获取训练数据,其中,训练数据包括文档理解任务下的样本文档图像、样本文档图像对应的样本问题和样本问题的样本回答;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档