2025年联邦学习数据采样策略考题(含答案与解析).docxVIP

2025年联邦学习数据采样策略考题(含答案与解析).docx

2025年联邦学习数据采样策略考题(含答案与解析)

一、单项选择题（每题3分，共15分）

1.联邦学习中数据非IID（Non-IID）特性对采样策略设计的核心挑战是？

A.参与方设备计算能力差异大

B.各参与方数据的标签分布或特征分布不一致

C.通信带宽限制导致数据传输延迟

D.隐私保护要求限制原始数据共享

答案：B

解析：非IID数据的本质是不同参与方的数据在标签分布（如某医院仅包含糖尿病患者影像）或特征分布（如不同设备采集的图像分辨率差异）上存在显著差异，这直接影响全局模型的收敛性和泛化能力。其他选项是联邦学习的普遍挑战，但非IID的核心是数据分布不一致。

2.以下哪种采样策略最适用于解决联邦学习中“长尾类别”数据不足的问题？

A.随机均匀采样

B.分层采样（StratifiedSampling）

C.基于梯度范数的动态采样

D.设备优先级采样（按计算能力排序）

答案：B

解析：分层采样通过将数据按类别（或其他关键特征）划分子层，在每层内独立采样，可确保长尾类别（如罕见病病例）在全局更新中获得足够的样本比例，避免因随机采样导致的类别缺失。其他选项中，随机均匀采样可能忽略类别不平衡，动态采样关注模型反馈，设备优先级采样侧重资源分配。

3.动态自适应采样策略中，触发“调整采样比例”的关键依据通常是？

更多 >