- 0
- 0
- 约8.84千字
- 约 12页
- 2026-03-07 发布于上海
- 举报
数据科学专业认证(CDSP)考试试卷
一、单项选择题(共10题,每题1分,共10分)
数据科学项目的核心流程中,“特征工程”通常出现在哪个阶段?
A.数据收集
B.数据清洗
C.模型构建前的预处理
D.模型评估后优化
答案:C
解析:特征工程是将原始数据转换为模型可理解的特征的过程,属于模型构建前的关键预处理步骤。A为数据获取阶段,B是处理数据质量问题,D是模型优化阶段,均不涉及特征工程的核心任务。
以下哪种方法最适合处理时间序列数据的缺失值?
A.直接删除缺失行
B.用全局均值填充
C.前向填充(ffill)
D.随机森林预测填充
答案:C
解析:时间序列数据具有时序依赖性,前向填充(ffill)利用相邻时间点的数值填充缺失值,能保留时序特征。A会丢失时间连续性,B忽略时序性,D计算成本高且可能引入噪声。
在混淆矩阵中,“假阳性(FalsePositive)”指的是?
A.实际为正类,模型预测为正类
B.实际为负类,模型预测为正类
C.实际为正类,模型预测为负类
D.实际为负类,模型预测为负类
答案:B
解析:混淆矩阵的行是真实标签,列是预测标签。假阳性即真实为负(行负)、预测为正(列正)的情况,对应B选项。A是真阳性(TP),C是假阴性(FN),D是真阴性(TN)。
以下哪种算法属于无监督学习?
A.逻辑回归
B.K-means聚类
C.随机森林
您可能关注的文档
- 2026年体育经纪人资格证考试题库(附答案和详细解析)(0113).docx
- 2026年健康评估师考试题库(附答案和详细解析)(0126).docx
- 2026年加拿大注册会计师(CPACanada)考试题库(附答案和详细解析)(0126).docx
- 2026年注册人力资源管理师考试题库(附答案和详细解析)(0126).docx
- 2026年注册结构工程师考试题库(附答案和详细解析)(0125).docx
- 2026年消防设施操作员考试题库(附答案和详细解析)(0101).docx
- 2026年监理工程师考试题库(附答案和详细解析)(0117).docx
- 2026年跨境物流管理师考试题库(附答案和详细解析)(0113).docx
- 2026年跨境物流管理师考试题库(附答案和详细解析)(0124).docx
- 2026年跨境电商运营师考试题库(附答案和详细解析)(0129).docx
原创力文档

文档评论(0)