- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN117573817B(45)授权公告日2025.07.08
(21)申请号202311340353.1
(22)申请日2023.10.16
(65)同一申请的已公布的文献号申请公布号CN117573817A
(43)申请公布日2024.02.20
(73)专利权人百度在线网络技术(北京)有限公
司
地址100085北京市海淀区上地十街10号
百度大厦三层
(72)发明人崔自鑫叶超朱坤鸿殷硕
郭宗仁国智李双龙贺登武刘林
(74)专利代理机构北京品源专利代理有限公司
11332
专利代理师魏亚南
(51)Int.CI.
GO6F16/3329(2025.01)
GO6F16/334(2025.01)
GO6F16/35(2025.01)
GO6N3/0455(2023.01)
GO6N3/048(2023.01)
GO6N3/08(2023.01)
(56)对比文件
CN114780846A,2022.07.22CN113434763A,2021.09.24
审查员张雪柔
权利要求书4页说明书12页附图5页
(54)发明名称
模型训练方法、相关性确定方法、装置、设备及存储介质
(57)摘要
CN117573817B本公开提供了模型训练方法、相关性确定方法、装置、设备及存储介质,人工智能技术领域,尤其涉及智能搜索、深度学习、自然语言处理及大语言模型等技术领域。具体实现方案为:获取样本输入数据,样本输入数据包括样本查询词、样本搜索结果和标准相关性理由;将样本输入数据输入至预设相关性模型,预设相关性模型中包括大语言模型以及全连接层,根据全连接层的输出确定样本相关性分数,以及根据大语言模型的输出确定样本相关性理由;根据样本相关性分数、样本输入数据对应的样本标签、样本相关性理由以及标准相关性理由确定目标损失关系,并
CN117573817B
可解释性。
获取样本输入数据,其中,所述样本输入数据包括样本查询词、样
获取样本输入数据,其中,所述样本输入数据包括样本查询词、样
本搜索结果和标准相关性理由,所述样本输入数据对应有样本标
签,所述样本标签用于表示所述样本查询词和所述样本搜索结果的
标准相关性分数,所述标准相关性理由为所述标准相关性分数对应
的相关性理由
S102
将所述样本输入数据输入至预设相关性模型,其中,所述预设相关性模型中包括大语言模型以及与所述大语言模型相连的全连接层
S103
基于预设并发逻辑向至少两个计算节点分发所述至少两个子任务,
以指示所述至少两个计算节点针对所接收到的子任务对应的行范
围,进行相应的列拷贝操作
S104
根据所述样本相关性分数、所述样本输入数据对应的样本标签、所
述样本相关性理由以及所述标准相关性理由确定目标损失关系,并
基于所述目标损失关系对所述预设相关性模型进行训练
CN117573817B权利要求书1/4页
2
1.一种相关性模型的训练方法,包括:
获取样本输入数据,其中,所述样本输入数据包括样本查询词、样本搜索结果和标准相关性理由,所述样本输入数据对应有样本标签,所述样本标签用于表示所述样本查询词和所述样本搜索结果的标准相关性分数,所述标准相关性理由为所述标准相关性分数对应的相关性理由;
将所述样本输入数据输入至预设相关性模型,其中,所述预设相关性模型中包括大语言模型以及与所述大语言模型相连的全连接层;
根据所述全连接层的输出确定样本相关性分数,以及根据所述大语言模型的输出确定样本相关性理由;
根据所述样本相关性分数、所述样本输入数据对应的样本标签、所述样本相关性理由以及所述标准相关性理由确定目标损失关系,并基于所述目标损失关系对所述预设相关性模型进行训练;
所述样本输入数据还包括样本分类标记和样本掩码标记,所述样本分类标记关联有第一描述信息,所述第一描述信息用于提示输出所述样本查询词和所述样本搜索结果的相关性分数,所述第一描述信息位于所述样本输入数据中的样本分类标记之前,并与样本分类标记相邻;所述样本掩码标记关联有第二描述信息,所述第二描述信息用于提示输出所述样本查询词和所述样本搜索结果的相关性理由,所述第二描述信息位于所
您可能关注的文档
- CN116284507B 一种γ-环糊精二维多孔有机聚合物及其制备方法与应用 (安徽大学).docx
- CN116310994B 一种视频片段提取方法、装置、电子设备及介质 (北京奇树有鱼文化传媒有限公司).docx
- CN116329462B 核电机组用大型Cr-Ni-Mo-V钢连接轴加工方法 (太原重工股份有限公司).docx
- CN116352697B 基于改进多目标pso算法的机械臂轨迹优化获取方法 (四川大学锦江学院).docx
- CN116382331B 多无人机快速调度方法、装置、设备及可读存储介质 (武汉大学).docx
- CN116405357B 一种菲涅尔域零导频ocdm水声通信的载波频偏估计补偿方法 (上海交通大学).docx
- CN116408034B 一种改性丁苯乳液的合成设备及合成方法 (浙江嘉晟新材料有限公司).docx
- CN116433548B 一种基于多级信息提取的高光谱与全色图像融合方法 (西安电子科技大学).docx
- CN116433647B 一种基于多任务学习的绝缘子图像质量评价方法及系统 (华北电力大学(保定)).docx
- CN116477719B 一种Fe修饰的改性生物质稀土尾矿粒子电极、制备方法及其应用 (西南石油大学).docx
- CN117795504B 柱塞泵设备的故障预警方法、装置以及柱塞泵设备系统 (烟台杰瑞石油服务集团股份有限公司).docx
- CN117855145B 自对准晶体管的源漏互连方法、自对准晶体管及器件 (北京大学).docx
- CN117855276B 一种具有结控二极管的沟槽mosfet器件及其制备方法 (湖北九峰山实验室).docx
- CN117857879B 图像画质增强方法、装置、电子设备和存储介质 (广州虎牙科技有限公司).docx
- CN117866442B 一种耐火陶瓷化发泡硅橡胶及其制备方法与应用 (蚌埠壹石通聚合物复合材料有限公司).docx
- CN118013856B 基于hm-trw和hagenn结构搜索的应急救援自动驾驶车辆碰撞风险预测方法及系统 (江苏大学).docx
- CN118095331B 电子设备、基于nfc的通信方法和系统 (支付宝(杭州)信息技术有限公司).docx
- CN118153468B 一种用于桥梁冲刷sph多相流模型的单层边界仿真方法 (东南大学).docx
- CN118184915B 一种丙烯与α-烯烃多嵌段共聚物弹性体材料及其制备方法和应用 (天津大学).docx
- CN118198018B 功率半导体器件的封装结构、制造方法及应用 (北京怀柔实验室).docx
原创力文档


文档评论(0)