- 0
- 0
- 约3.6万字
- 约 50页
- 2026-01-24 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119293514A(43)申请公布日2025.01.10
(21)申请号202411831139.0
(22)申请日2024.12.12
(71)申请人连连银通电子支付有限公司
地址310051浙江省杭州市滨江区越达巷
79号1号楼11楼
申请人连连(杭州)信息技术有限公司
(72)发明人王愚侯兴翠
GO6V10/80(2022.01)
GO6F18/25(2023.01)
GO6N3/0442(2023.01)
GO6N3/0455(2023.01)
GO6N3/0464(2023.01)
GO6N3/0895(2023.01)
(74)专利代理机构广州三环专利商标代理有限公司44202
专利代理师方秀琴
(51)Int.CI.
GO6FGO6V
GO6FGO6V
18/214(2023.01)
10/774(2022.01)
40/289(2020.01)10/52(2022.01)
权利要求书4页
说明书19页附图3页
(54)发明名称
用于多语言任务的模型预训练方法和装置
(57)摘要
CN119293514A本申请提供了用于多语言任务的模型预训练方法和装置,涉及人工智能技术领域,方法包括:获取多模态训练数据集,训练数据集包括具有多语言内容的多个样本文本数据和多个样本图文对数据,涵盖通用领域和预设业务领域;基于多个样本图文对数据,对初始模型进行视觉特征和文本特征对齐的对比学习训练,在训练过程中冻结解码模块的模型参数并调整视觉编码器和投影模块的模型参数,至满足第一结束条件;基于多个样本图文对数据和多个样本文本数据,对满足第一结束条件的初始模型进行内容理解的约束训练,在训练过程中调整视觉编码器、投影模块和解码模块的模型参数,至满足第二结束
CN119293514A
获取多模态训练数据集和初始模型,训练数据集包括多个样
本文本数据和多个样本图文对数据,多个样本图文对数据和
多个样本文本数据包括多种语言内容,且多个样本图文对数
据包括通用领域的样本图文对数据和目标场景中预设业务领
域的样本图文对数据,多个样本文本数据包括预设业务领域
的文本数据,初始模型包括依次连接的视觉编码器、投影模
块和解码模块,解码模块是基于大语言模型构建的
基于多个样本图文对数据,对初始模型进行视觉特征和文本
特征对齐的对比学习训练,在训练过程中冻结解码模块的模
型参数并调整视觉编码器和投影模块的模型参数,至满足第
一结束条件
基于多个样本图文对数据和多个样本文本数据,对满足第一
结束条件的初始模型进行内容理解的约束训练,在训练过程
中调整视觉编码器、投影模块和解码模块的模型参数,至满
足第二结束条件
将满足第二结束条件的初始模型确定为目标模型:在训练过
程中,结合预设业务领域对应的目标词库对预设业务领域的
样本图文对数据中的文本和样本文本数据进行分词处理,以
作为投影模块的输入
S201
S203
S205
S207
CN119293514A权利要求书1/4页
2
1.一种用于多语言任务的模型预训练方法,其特征在于,所述方法包括:
获取多模态训练数据集和初始模型,所述训练数据集包括多个样本文本数据和多个样本图文对数据,所述多个样本图文对数据和所述多个样本文本数据包括多种语言内容,且所述多个样本图文对数据包括通用领域的样本图文对数据和目标场景中预设业务领域的样本图文对数据,所述多个样本文本数据包括所述预设业务领域的文本数据,所述初始模型包括依次连接的视觉编码器、投影模块和解码模块,所述解码模块是基于大语言模型构建的;
基于所述多个样本图文对数据,对所述初始模型进行视觉特征和文本特征对齐的对比学习训练,在训练过程中冻结所述解码模块的模型参数并调整所述视觉编码器和所述投影模块的模型参数,至满足第一结束条件;
基于所述多个样本图文对数据和所述多个样本文本数据,对满足所述第一结束条件的初始模型进行内容理解的约束训练,在训练过程中调整所述视觉编码器、所述投影模块和所述解码模块的模型参数,至满足第二结束条件;
您可能关注的文档
- CN119297083A 深宽比依赖性降低的选择性蚀刻的方法 (朗姆研究公司).docx
- CN119296533A 语音交互方法、装置、终端及存储介质 (深圳引望智能技术有限公司).docx
- CN119296516A 基于rag的领域化语音识别方法及系统 (中科南京人工智能创新研究院).docx
- CN119296378A 一种船舶用的智能航行系统及方法 (广东海洋大学).docx
- CN119296376A 一种基于多模态物联感知的公路风险模拟避让系统及方法 (四川云控交通科技有限责任公司).docx
- CN119296322A 基于全息图的路网安全预警方法、装置及存储介质 (深圳市拓必达科技有限公司).docx
- CN119296239A 基于视频远程监控的防盗监测预警方法 (广州市伟粤通讯设备有限公司).docx
- CN119295886A 基于多尺度特征融合的X-ray图像违禁品检测方法 (齐鲁工业大学(山东省科学院)).docx
- CN119295883A 一种基于多模态感知融合的自主机器人决策系统及其方法 (龙岩丽泰信息技术有限公司).docx
- CN119295827A 通过深度学习增强缺陷检测效率的无损探伤方法 (苏州天顺复合材料科技有限公司).docx
- 2026年中国磷酸铁锂电池市场运行态势报告.docx
- 2026年中国磷矿行业全景调研及发展前景报告.docx
- 2026年中国磷复肥行业投资现状及十五五盈利空间评估报告.docx
- 2026年中国磷矿行业分析及发展趋势预测.docx
- 2026年中国领带夹市场运营态势报告.docx
- 2026年中国电子信息市场全景调查与投资前景预测报告.docx
- 2026年中国移动运营及电信增值业务行业供需趋势及投资风险研究报告.docx
- 2026年中国海上巡逻艇行业竞争分析及投资前景预测报告.docx
- 2026年中国桂圆行业市场监测与投资方向研究报告.docx
- 2026年中国领带市场发展现状与发展动向研究报告.docx
最近下载
- 2021一级消防工程师继续教育考试石油化工类答案 .pdf VIP
- 中考模拟试卷二.docx VIP
- T_SDJSXH 08-2024 智能施工升降机安全技术规程.pdf VIP
- 欠条模板 (2)PDF打印.pdf VIP
- DZT0151-2015 区域地质调查中遥感技术规定(1:50000).pdf VIP
- 【验收报告】项目验收报告.docx VIP
- 原子物理学第二章.ppt VIP
- 内部控制审计【外文翻译】.pdf VIP
- 德斯勒 人力资源管理(英文版第15版) 课件Dessler15e_HRM_Ch07.pptx VIP
- 2025年中小学生寒假安全教育主题班会PPT课件.pptx VIP
原创力文档

文档评论(0)