- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120234158A(43)申请公布日2025.07.01
(21)申请号202510716453.2
(22)申请日2025.05.30
(71)申请人深圳市查策网络信息技术有限公司地址518000广东省深圳市龙华区民治街
道北站社区鸿荣源北站中心B塔2309(数字创新中心)
(72)发明人王云丞兰林林正春彭勇建徐铁峰
(74)专利代理机构深圳市查策知识产权代理事务所(普通合伙)44527
专利代理师胡小登
(51)Int.CI.
GO6NGO6N
3/096(2023.01)
3/098(2023.01)
GO6F9/50(2006.01)
GO6N3/08(2023.01)
GO6N3/084(2023.01)
权利要求书2页说明书9页附图1页
(54)发明名称
一种基于大数据分布式计算的分类模型训
练方法
(57)摘要
CN120234158A本发明公开了一种基于大数据分布式计算的分类模型训练方法,涉及大数据处理与机器学习技术领域,所述方法包括S1、获取分布式计算节点间的通信延迟数据,并分析延迟特性以生成调控参数,S2、基于调控参数动态确定每个训练批次的批量大小,确保同步效率最优化,S3、将调整后的批量大小分配至各节点,执行模型前向与反向传播计算过程,S4、收集各节点计算结果进行参数聚合更新,完成分类模型的迭代训练;该基于大数据分布式计算的分类模型训练方法,根
CN120234158A
获取
分布式计算节点间的通信延迟数据,并分析延迟特性以生成调控参数
基于调控参数动态确定每个训练批次的批量大小,确保同步效率最优化
将调整后的批量大小分配至各节点,执行模型前向与反向传播计算过程
S1
S2
S3
收集各节点计算结果进行参数聚合更新,完成分类模型的
迭代训练S4
CN120234158A权利要求书1/2页
2
1.一种基于大数据分布式计算的分类模型训练方法,其特征在于,所述方法包括:
S1、获取分布式计算节点间的通信延迟数据,并分析延迟特性以生成调控参数,包括每隔固定时间采集各节点一次网络延迟数据,设定延迟阈值,将其中延迟小于阈值的样本时段累计为有效通信时间,计算每个节点的通信效率;
S2、基于调控参数动态确定每个训练批次的批量大小,确保同步效率最优化,包括根据每个节点通信效率计算出每个节点的实际训练批量大小,将非整数部分舍弃或补齐,调整结果写入分布式训练管理调度器,用于任务分发;
S3、将调整后的批量大小分配至各节点,执行模型前向与反向传播计算过程,包括收集每个节点的上一轮训练平均响应时间,计算当前批量任务对应的计算压力,根据当前批量任务对应的计算压力分配线程并发数、I/0等待队列长度;
S4、收集各节点计算结果进行参数聚合更新,完成分类模型的迭代训练,包括各节点上传本地模型参数副本,计算节点梯度波动率,再取其倒数定义为权重,聚合最终全局参数,将聚合后的模型更新参数同步至全部节点,开始下一轮迭代。
2.根据权利要求1所述的一种基于大数据分布式计算的分类模型训练方法,其特征在于:所述S1中计算每个节点的通信效率包括以固定时间间隔,依次从各个分布式计算节点收集一次网络通信延迟数据,在每个时间间隔内,对所有采集到的延迟样本进行判断,设定延迟阈值,筛选出小于设定阈值的样本,统计当前这一时间窗口的总观测时间,即从开始采集到结束所经历的总时间段,以有效通信时间除以总观测时间,得到节点的通信效率值,将通信效率值作为节点的通信调控参数。
3.根据权利要求1所述的一种基于大数据分布式计算的分类模型训练方法,其特征在于:所述S2中计算出每个节点的实际训练批量大小包括接收计算得到的各节点通信效率值,设定一个标准批量大小,作为初始训练任务量的参考基准,将每一节点的通信效率值作为权重,除以每一节点的通信效率值作为权重与一的和,再乘以标准批量大小,得到节点的初步训练批量大小。
4.根据权利要求1所述的一种基于大数据分布式计算的分类模型训练方法,其特征在于:所述S3中计算当前批量任务对应的计算压力具体包括收集每个分布式计算节点在上一轮训练中所经历的平均响应时间,结合节点当前被分配的训练批次任务的大小,与平均响应时间进行乘
您可能关注的文档
- CN117725480B 一种避雷器故障智能检测方法及系统 (国网山东省电力公司青岛供电公司).docx
- CN117810391B 正极材料及其制备方法、电池 (深圳市贝特瑞纳米科技有限公司).docx
- CN117861676B 双催化中心催化剂及其制备方法和应用和二元醇的制备方法 (中国石油化工股份有限公司).docx
- CN117911584B 基于文本提示词和图像驱动的内容生成方法、设备、介质 (上海人工智能创新中心).docx
- CN117985557B 一种电梯集群控制方法及系统 (尼得科康迪克电梯技术(无锡)有限公司).docx
- CN117993287B 一种铅铋反应堆智能设计优化方法 (南华大学).docx
- CN118041102B 一种消除中点电流的三相四桥臂三电平逆变器调制方法 (华中科技大学).docx
- CN118120007B 一种面板显示方法、装置、系统、设备及存储介质 (京东方科技集团股份有限公司).docx
- CN118188373B 使用含能改性工质的重频等离子体射流点火系统及方法 (西安交通大学).docx
- CN118365884B 用于三维磁共振图像的双向注意力并行网络分割方法 (河北工程大学).docx
最近下载
- 2024-2025学年湖南省多校联考高一(上)期中数学试卷(含答案).docx VIP
- 临床痴呆评定量表(CDR):操作指南与临床应用解析.docx VIP
- UL 1017 吸尘器安规(中文).doc VIP
- 广汽丰田VI手册.pdf VIP
- 医疗机构医用耗材管理规范(国卫医政发〔2025〕31 号,附解读).docx VIP
- 基于多技术融合的变电站设备无线温度监测系统创新设计与实践.docx VIP
- 协会注销方案.pdf VIP
- 临床痴呆评定量表(CDR).docx VIP
- ME4312应用指导V.1 2016.07.07微盟原厂规格书.pdf VIP
- 剑桥(join in)版六年级英语上册期末测试 (6).docx VIP
原创力文档


文档评论(0)