2026年大数据开发工程师考试《数据挖掘》模拟.docVIP

  • 0
  • 0
  • 约4.59千字
  • 约 14页
  • 2026-05-28 发布于山东
  • 举报

2026年大数据开发工程师考试《数据挖掘》模拟.doc

2026年大数据开发工程师考试《数据挖掘》模拟

姓名:_____?准考证号:_____?得分:______

一、单选题(总共10题,每题2分)

1.数据挖掘过程中,用于描述数据集中数据分布特征的统计量不包括以下哪一项?

A.均值

B.中位数

C.方差

D.协方差

2.在决策树算法中,选择分裂属性时常用的指标是?

A.信息增益

B.信息增益率

C.基尼系数

D.上述所有都是

3.关联规则挖掘中,支持度(Support)和置信度(Confidence)分别衡量了什么?

A.规则的频率和规则的强度

B.规则的强度和规则的频率

C.规则的覆盖范围和规则的准确性

D.规则的准确性和规则的覆盖范围

4.在聚类算法中,K-means算法的主要缺点是?

A.对初始聚类中心敏感

B.无法处理高维数据

C.只能处理数值型数据

D.计算复杂度较高

5.以下哪种方法不属于过拟合的解决方法?

A.增加训练数据

B.正则化

C.降低模型复杂度

D.增加模型参数

6.在贝叶斯分类器中,朴素贝叶斯假设所有属性之间相互独立,这种假设的目的是?

A.降低计算复杂度

B.提高模型精度

C.增加模型泛化能力

D.使模型更易于

文档评论(0)

1亿VIP精品文档

相关文档