数据数量和质量偏移下的联邦学习研究.pdf

数据数量和质量偏移下的联邦学习研究.pdf

摘要

为解决数据孤岛问题,联邦学习作为一种分布式机器学习方法,能够在不共享本地

数据的前提下,实现多个客户端协同训练一个全局模型。然而,由于其分布式特性,客

户端数据之间不可避免的统计异构性,成为了影响模型训练的主要因素。具体来说,这

种数据异构不仅表现为各客户端数据的非独立同分布,还可能导致数据数量偏移和数据

质量偏移的问题。其中,数据数量偏移可能导致全局数据呈现长尾分布,而数据质量偏

移则可能引发标签噪声。本文重点研究了上述两个关键问题,针对其导致的全局模型精

度下降的现象,提出了解决方案。具体研究内容如

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档