大数据分析师数据挖掘题库及解析.docxVIP

  • 0
  • 0
  • 约9.13千字
  • 约 24页
  • 2026-07-03 发布于上海
  • 举报

大数据分析师数据挖掘题库及解析

一、单项选择题(共10题,每题1分,共10分)

数据挖掘的核心目标是以下哪一项?

A.对数据进行简单的统计汇总计算

B.从海量无规律的数据中提取隐含的、有价值的模式与信息

C.实现海量数据的分布式存储与调用

D.将数据转换为可视化图表展示给业务方

答案:B

解析:选项B符合数据挖掘的核心定义,数据挖掘是跨统计学、机器学习、数据库的交叉领域,核心是挖掘未知的有用信息。选项A属于基础数据分析的工作内容,选项C属于大数据存储架构的工作范畴,选项D属于数据可视化的工作内容,均不属于数据挖掘的核心目标。

以下哪一种方法不属于缺失值处理的常用填充方法?

A.均值/中位数填充

B.热卡填充

C.直接删除包含缺失值的样本

D.特征独热编码

答案:D

解析:选项D的独热编码是针对分类特征的编码方式,作用是将文本类分类特征转换为模型可识别的数值格式,不属于缺失值填充方法。选项A、B都是常见的缺失值填充方式,选项C属于缺失值处理的一种极端方式,仅在缺失占比极低时使用,也属于缺失值处理范畴。

以下算法中属于监督学习分类算法的是?

A.K-Means算法

B.CART决策树算法

C.Apriori算法

D.PCA主成分分析算法

答案:B

解析:选项B的CART决策树既可以用于分类也可以用于回归,属于典型的监督学习算法。选项A是无监督聚类算法,选项C是关

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档