数据挖掘考试题库及分析.docxVIP

  • 2
  • 0
  • 约9.24千字
  • 约 23页
  • 2026-06-26 发布于上海
  • 举报

数据挖掘考试题库及分析

一、单项选择题(共10题,每题1分,共10分)

以下关于数据挖掘核心本质的描述,正确的是

A.从大量、有噪声的实际数据中提取潜在、有用、可理解的模式与知识

B.对数据进行简单的求和、平均值计算等统计汇总操作

C.实现海量数据的分布式存储与快速查询

D.按照用户编写的查询语句精准匹配符合要求的数据条目

答案:A

解析:选项A是数据挖掘的标准定义,表述正确。选项B属于基础统计分析的范畴,不属于数据挖掘的核心;选项C是分布式数据库的核心功能,和数据挖掘无关;选项D是SQL查询的作用,不需要挖掘潜在模式。

下列数据挖掘任务中,属于无监督学习范畴的是

A.信用卡欺诈检测

B.用户价值等级分类

C.商品关联规则挖掘

D.月度商品销量预测

答案:C

解析:选项C的关联规则挖掘不需要提前标注的标签,属于无监督学习。其余三个选项都需要带标签的训练数据,属于有监督学习范畴。

下列指标中,用于衡量关联规则中前件发生时后件发生概率的是

A.支持度

B.置信度

C.提升度

D.轮廓系数

答案:B

解析:选项B的置信度定义就是前件发生时后件发生的概率,符合题意。选项A是项集同时在总样本中出现的概率;选项C是衡量规则的有效程度,判断规则是否比随机猜测的效果更好;选项D是聚类模型的评价指标。

决策树进行属性选择时,下列哪个指标衡量的是属性划分后样本集合不确定性的减少

文档评论(0)

1亿VIP精品文档

相关文档