- 2
- 0
- 约6.49千字
- 约 15页
- 2026-06-02 发布于山东
- 举报
2026年数据科学家《数据挖掘》专项训练
姓名:_____?准考证号:_____?得分:__________
2026年数据科学家《数据挖掘》专项训练
一、选择题(每题2分,总共10题)
1.在数据挖掘过程中,用于描述数据集中某个属性的取值分布情况的统计量是?
A.协方差
B.方差
C.均值
D.中位数
2.下列哪种算法属于监督学习算法?
A.K-means聚类
B.决策树
C.主成分分析
D.神经网络
3.在数据预处理中,处理缺失值的方法不包括?
A.删除含有缺失值的行
B.使用均值填充
C.使用众数填充
D.使用回归模型预测缺失值
4.下列哪种模型适用于处理非线性关系?
A.线性回归
B.逻辑回归
C.决策树
D.线性判别分析
5.在特征选择中,使用信息增益作为评价标准的方法是?
A.Lasso回归
B.决策树
C.递归特征消除
D.线性判别分析
6.下列哪种数据挖掘任务适用于分类问题?
A.聚类分析
B.关联规则挖掘
C.分类
D.回归分析
7.在数据挖掘过程中,用于评估模型泛化能力的方法是?
A.过拟合
B.欠拟合
C.交叉验证
D.决策树
8.下列哪种算法属于无监督学习算法?
A.线性回归
B.决策树
C.K-means聚类
D.逻辑回归
9.在数据预处理中,用于将数据缩放到特定
原创力文档

文档评论(0)