2025年联邦学习数据采样策略考题(含答案与解析).docxVIP

  • 1
  • 0
  • 约4.23千字
  • 约 11页
  • 2026-06-01 发布于四川
  • 举报

2025年联邦学习数据采样策略考题(含答案与解析).docx

2025年联邦学习数据采样策略考题(含答案与解析)

一、单项选择题(每题3分,共15分)

1.联邦学习中数据非IID(Non-IID)特性对采样策略设计的核心挑战是?

A.参与方设备计算能力差异大

B.各参与方数据的标签分布或特征分布不一致

C.通信带宽限制导致数据传输延迟

D.隐私保护要求限制原始数据共享

答案:B

解析:非IID数据的本质是不同参与方的数据在标签分布(如某医院仅包含糖尿病患者影像)或特征分布(如不同设备采集的图像分辨率差异)上存在显著差异,这直接影响全局模型的收敛性和泛化能力。其他选项是联邦学习的普遍挑战,但非IID的核心是数据分布不一致。

2.以下哪种采样策略最适用于解决联邦学习中“长尾类别”数据不足的问题?

A.随机均匀采样

B.分层采样(StratifiedSampling)

C.基于梯度范数的动态采样

D.设备优先级采样(按计算能力排序)

答案:B

解析:分层采样通过将数据按类别(或其他关键特征)划分子层,在每层内独立采样,可确保长尾类别(如罕见病病例)在全局更新中获得足够的样本比例,避免因随机采样导致的类别缺失。其他选项中,随机均匀采样可能忽略类别不平衡,动态采样关注模型反馈,设备优先级采样侧重资源分配。

3.动态自适应采样策略中,触发“调整采样比例”的关键依据通常是?

文档评论(0)

1亿VIP精品文档

相关文档