- 2
- 0
- 约6.72千字
- 约 20页
- 2026-06-04 发布于四川
- 举报
2026年大数据分析应用技能理论考核试题及答案
一、单项选择题(每题2分,共20分)
1.在大样本高维大数据预处理场景中,以下哪种缺失值处理方法的预测准确性最优?
A.均值填充
B.中位数填充
C.基于大语言模型的生成式填充
D.直接删除含缺失值的样本
答案:C
解析:传统均值、中位数填充仅适用于低维小样本场景,删除样本会造成大量数据信息损失,当前主流大数据预处理流程中,针对高维大样本的缺失值,基于大模型的生成式填充可以结合字段语义和样本特征生成更贴合真实分布的填充值,准确率远高于传统统计方法。
2.根据我国2025年修订的《生成式人工智能服务管理暂行办法》,以下哪类数据可合法用于训练企业大数据分析模型?
A.未经用户授权爬取的公开平台用户评论数据
B.完成脱敏脱标识化处理且通过合规评估的公开行业统计数据
C.未取得用户明确授权的个人位置轨迹数据
D.企业跨部门共享的未加密个人敏感信息数据
答案:B
解析:修订后的管理办法明确要求生成式AI训练数据必须具备合法来源与授权,经过合规处理的公开行业数据属于合法训练数据,其余选项均违反《个人信息保护法》与生成式AI管理相关规定。
3.因果推断方法中,断点回归设计的核心适用场景是?
A.评估政策实施在断点阈值两侧的处理效应
B.分析无明显分段变量的因果关系
C.随机对照实验的效应估计
D.时间序列的未来趋势预测
答案
原创力文档

文档评论(0)