- 0
- 0
- 约2.93万字
- 约 44页
- 2026-01-22 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN113011603B(45)授权公告日2025.01.10
(21)申请号202110287041.3
(22)申请日2021.03.17
(65)同一申请的已公布的文献号申请公布号CN113011603A
(43)申请公布日2021.06.22
(73)专利权人深圳前海微众银行股份有限公司地址518000广东省深圳市前海深港合作
区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
(72)发明人梁新乐刘洋陈天健
(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287
专利代理师张志江
(51)Int.CI.
GO6N20/00(2019.01)
GO6N3/098(2023.01)
(56)对比文件
XinleLiang等.Self-supervisedCross-siloFederatedNeuralArchitecture
Search.arXiv:2101.11896v2.2021,摘要,第I-VI节.
审查员田子茹
权利要求书3页说明书17页附图3页
(54)发明名称
模型参数更新方法、装置、设备、存储介质及程序产品
(57)摘要
CN113011603B本发明公开了一种模型参数更新方法、装置、设备、存储介质及程序产品,所述方法包括:计算近端优化损失,其中,所述近端优化损失表征所述第一设备中第一模型的参数在本轮本地迭代中的参数值相比于在预设历史轮次的本地迭代中参数值的变化量;基于所述近端优化损失、所述第一模型在本轮本地迭代中的模型输出以及从所述第二设备接收到的纵向联邦中间结果,计算得到所述参数对应的梯度值;采用所述梯度值更新所述参数,以完成本轮本地迭代。本
CN113011603B
计算近端优化损失,其中,近端优化损失表征第一设备中第一模型的参数在本轮本地选代中的参数值相比于在预设历史轮次的本地迭代中参数值的变化量
基于近璃优化损失、第一模型在本轮本地迭代中的模型输出以及从第二设备接收到的纵向联邦中间结果,计算得到参数对应的梯度值
采用梯度值更新参数,以完成本轮本地迭代
S10
S20
CN113011603B权利要求书1/3页
2
1.一种模型参数更新方法,其特征在于,所述方法应用于参与纵向联邦学习的第一设备,所述第一设备与参与纵向联邦学习的第二设备通信连接,所述方法包括以下步骤:
将所述第一设备中第一模型的参数在本轮本地迭代中的参数向量与在预设历史轮次的本地迭代中的参数向量进行对应元素相减,得到差向量;
计算所述差向量中各元素的平方和或所述平方和的平方根,基于所述平方和或所述平方和的平方根,得到近端优化损失;
基于所述近端优化损失、所述第一模型在本轮本地迭代中的模型输出以及从所述第二设备接收到的纵向联邦中间结果,计算得到所述参数对应的梯度值,当所述第一设备为拥有标签数据的参与方时,所述纵向联邦中间结果为所述第二设备中模型的输出,
所述基于所述近端优化损失、所述第一模型在本轮本地迭代中的模型输出以及从所述第二设备接收到的纵向联邦中间结果,计算得到所述参数对应的梯度值的步骤包括:
将所述第一设备的训练数据输入所述第一设备中的第一模型进行处理,得到所述第一模型在本轮本地迭代中的模型输出;
根据所述模型输出和所述纵向联邦中间结果计算得到预测结果,并基于所述预测结果和所述训练数据对应的标签数据计算得到预测损失;
将所述预测损失和所述近端优化损失相加得到总损失,基于所述总损失计算得到所述参数对应的梯度值;
采用所述梯度值更新所述参数,以完成本轮本地迭代。
2.如权利要求1所述的模型参数更新方法,其特征在于,当所述第二设备为拥有标签数据的参与方时,所述纵向联邦中间结果为所述第二设备中预测损失相对于所述第一设备在本轮联合参数更新时发送的第一模型的输出的梯度值,
所述基于所述近端优化损失、所述第一模型在本轮本地迭代中的模型输出以及从所述第二设备接收到的纵向联邦中间结果,计算得到所述参数对应的梯度值的步骤包括:
将所述第一设备的训练数据输入所述第一设备的第一模型进行处理,得到所述第一模型在本轮本地迭代中的模型输出;
根据所述模型输出和所述纵向联邦中间结果计算得到所述预测损失相对于所述参数的第一子梯度值;
计算所述近端优化损失相对于所述参数的第二子梯度值,将所述第一子
您可能关注的文档
- CN112903545B 一种多通道传感系统和检测方法 (华侨大学).docx
- CN112906394B 地址识别方法、装置、设备和存储介质 (北京字节跳动网络技术有限公司).docx
- CN112934823B 一种物料智能识别自动清洗整理设备及方法 (古田县庄鑫菌业有限公司).docx
- CN112948662B 一种推荐方法、装置和用于推荐的装置 (北京搜狗科技发展有限公司).docx
- CN113011292B 一种光学传感像素电路及其驱动方法、传感器和显示面板 (京东方科技集团股份有限公司).docx
- CN113032568B 一种基于bert+bilstm+crf并融合句型分析的查询意图识别方法 (同方知网(北京)技术有限公司).docx
- CN113052517B 取货机器人、取货方法、计算机可读存储介质 (北京极智嘉科技股份有限公司).docx
- CN113141255B 用于在处理设备、对应的处理设备和计算机程序产品中对数据执行密码运算的方法 (意法半导体股份有限公司).docx
- CN113200179B 具有真空冷却站的深拉包装机和真空冷却热包装产品的方法 (莫迪维克西普哈根牧勒股份及两合公司).docx
- CN113206308B 用于对电池充电的方法 (三星Sdi株式会社).docx
最近下载
- 2025年最新部编版五年级语文下册1-8单元教材分析(全册) .pdf VIP
- 山东省烟台龙口市(五四制)2024-2025学年六年级上学期期末考试历史试题.pdf VIP
- 青少年编程:NOIP CSP 初赛篇.pdf VIP
- 2024年河南豫能控股股份有限公司招聘笔试真题汇总.docx VIP
- 小学科学教育三年规划实施方案.docx VIP
- 视频会议摄像机安装指导书.docx VIP
- 波束匹配-5G网络自适应技术.doc VIP
- 2025年河南豫能控股股份有限公司招聘考试笔试试题(含答案).docx VIP
- 急性心肌梗死PBL教学指南:临床思维培养与典型案例实战解析.pptx VIP
- iso9000实战大全iso9001教材iso9000培训讲义iso9000简述.pptx VIP
原创力文档

文档评论(0)