2025年《数据分析与挖掘》期末考试试卷附有答案.docxVIP

  • 8
  • 0
  • 约4.57千字
  • 约 12页
  • 2026-05-30 发布于四川
  • 举报

2025年《数据分析与挖掘》期末考试试卷附有答案.docx

2025年《数据分析与挖掘》期末考试试卷附有答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据清洗的常见操作?

A.处理缺失值

B.标准化数据范围

C.检测并修正异常值

D.删除重复记录

2.在特征选择中,互信息法主要用于衡量:

A.特征与目标变量的线性相关性

B.特征之间的共线性程度

C.特征与目标变量的非线性关联强度

D.特征的方差大小

3.对于二分类问题,若模型将正类预测为负类,负类预测为正类的数量均较多,则混淆矩阵中表现为:

A.真阳性(TP)和真阴性(TN)较高

B.假阳性(FP)和假阴性(FN)较高

C.TP和FP较高

D.TN和FN较高

4.关于K-means聚类算法,以下说法错误的是:

A.需预先指定聚类数k

B.对初始中心敏感

C.适用于非凸形状的簇

D.基于欧式距离计算样本相似性

5.在关联规则挖掘中,若规则“牛奶→面包”的支持度为15%,置信度为60%,而“面包”的支持度为25%,则该规则的提升度为:

A.0.6

B.1.2

C.2.4

D.3.0

6.数据标准化(Z-score)的公式为:

A.(x-μ)/σ

B.(x-min)/(max-min)

C.x/log(x)

D.x

文档评论(0)

1亿VIP精品文档

相关文档