大数据挖掘试题及分析.docxVIP

  • 2
  • 0
  • 约1.04万字
  • 约 26页
  • 2026-06-09 发布于江苏
  • 举报

大数据挖掘试题及分析

一、单项选择题(共10题,每题1分,共10分)

以下选项中,最符合大数据挖掘核心目标的描述是

A.存储海量原始数据不做任何处理

B.从海量、模糊、随机的海量数据中提取隐含的、有潜在价值的知识和规律

C.对所有业务数据进行加密保证数据安全

D.仅完成数据集基础统计量如均值、最大值的计算

答案:B

解析:大数据挖掘的核心是从数据中提炼未被人工发现的高价值规律,A是大数据存储环节的目标,C属于数据安全领域的工作内容,D属于基础描述统计的范畴,都不属于大数据挖掘的核心目标。

在数据预处理环节中,针对占总样本比例低于5%的缺失值,以下哪种处理方式是最合理的

A.直接将整个数据集全部删除

B.直接用0填充所有缺失值不需要做校验

C.结合业务场景用同属性均值、中位数或同类样本均值填充

D.放弃处理所有带缺失值的样本直接进入建模环节

答案:C

解析:填充缺失值需要结合业务逻辑选择适配的填充方式,避免引入额外偏差。A会直接损失大量有效数据,B的无差别0填充会扭曲属性的真实分布,D会导致可用训练样本量大幅减少,影响模型泛化能力。

经典的“啤酒与尿布”购物篮分析案例,使用的核心关联规则算法是

A.Apriori算法

B.K-Means算法

C.逻辑回归算法

D.决策树算法

答案:A

解析:Apriori是关联规则挖掘的经典算法,专门用于从交易数据中挖掘不同商

文档评论(0)

1亿VIP精品文档

相关文档