数据挖掘习题集及答案.docxVIP

  • 4
  • 0
  • 约9.46千字
  • 约 23页
  • 2026-06-12 发布于上海
  • 举报

数据挖掘习题集及答案

一、单项选择题(共10题,每题1分,共10分)

数据挖掘的核心目标是?

A.从大量无规则的数据中提取有潜在价值的模式和知识

B.实现海量数据的分布式存储和快速查询

C.对数据进行简单的求和、求平均值等统计汇总

D.完全替代业务人员做出所有运营决策

答案:A

解析:选项A符合数据挖掘的核心定义,数据挖掘是跨统计学、机器学习、数据库等领域的交叉技术,核心是挖掘数据背后的隐含规律;选项B是分布式数据库的核心功能,不属于数据挖掘范畴;选项C是传统统计学的基础操作,没有涉及规律挖掘;选项D表述过于绝对,数据挖掘仅能辅助决策,无法替代人的业务判断。

下列哪项不属于数据预处理的常用操作?

A.对缺失的用户年龄数据用同群体的年龄均值填充

B.剔除明显不符合业务逻辑的异常交易记录

C.将不同量纲的特征映射到0到1的区间内完成归一化

D.将训练完成的模型部署到线上业务系统中

答案:D

解析:数据预处理是建模前对原始数据的加工操作,选项A属于缺失值处理、选项B属于异常值处理、选项C属于数据变换,均属于预处理环节;选项D的模型部署是模型训练、评估完成后的落地环节,不属于预处理范畴。

下列关于分类和聚类的表述正确的是?

A.分类属于无监督学习,聚类属于有监督学习

B.分类算法训练需要带标注的样本,聚类算法不需要先验标注

C.分类的输出是样本的簇划分结果,聚类的输出

文档评论(0)

1亿VIP精品文档

相关文档