- 1
- 0
- 约4.23千字
- 约 11页
- 2026-06-01 发布于四川
- 举报
2025年联邦学习数据采样策略考题(含答案与解析)
一、单项选择题(每题3分,共15分)
1.联邦学习中数据非IID(Non-IID)特性对采样策略设计的核心挑战是?
A.参与方设备计算能力差异大
B.各参与方数据的标签分布或特征分布不一致
C.通信带宽限制导致数据传输延迟
D.隐私保护要求限制原始数据共享
答案:B
解析:非IID数据的本质是不同参与方的数据在标签分布(如某医院仅包含糖尿病患者影像)或特征分布(如不同设备采集的图像分辨率差异)上存在显著差异,这直接影响全局模型的收敛性和泛化能力。其他选项是联邦学习的普遍挑战,但非IID的核心是数据分布不一致。
2.以下哪种采样策略最适用于解决联邦学习中“长尾类别”数据不足的问题?
A.随机均匀采样
B.分层采样(StratifiedSampling)
C.基于梯度范数的动态采样
D.设备优先级采样(按计算能力排序)
答案:B
解析:分层采样通过将数据按类别(或其他关键特征)划分子层,在每层内独立采样,可确保长尾类别(如罕见病病例)在全局更新中获得足够的样本比例,避免因随机采样导致的类别缺失。其他选项中,随机均匀采样可能忽略类别不平衡,动态采样关注模型反馈,设备优先级采样侧重资源分配。
3.动态自适应采样策略中,触发“调整采样比例”的关键依据通常是?
原创力文档

文档评论(0)