大数据分析实战赛题库及答案.docVIP

  • 0
  • 0
  • 约1.25千字
  • 约 6页
  • 2026-01-28 发布于河北
  • 举报

大数据分析实战赛题库及答案

一、单项选择题(每题2分,共10题)

1.以下哪种数据类型不属于数值型数据?()

A.整数

B.字符串

C.浮点数

D.双精度数

2.数据清洗的目的不包括()

A.去除重复数据

B.填补缺失值

C.增加数据维度

D.纠正错误数据

3.在数据分析中,用于描述数据离散程度的统计量是()

A.均值

B.中位数

C.方差

D.众数

4.以下哪个不是常见的数据可视化工具?()

A.Excel

B.Python

C.Tableau

D.PowerBI

5.关联规则挖掘中,支持度的计算公式是()

A.支持该规则的事务数/总事务数

B.支持该规则的事务数/包含前项的事务数

C.支持该规则的事务数/包含后项的事务数

D.支持该规则的事务数/包含前项或后项的事务数

6.决策树算法中,用于选择最优划分属性的指标是()

A.信息增益

B.基尼指数

C.均方误差

D.A和B

7.机器学习中,以下哪种算法属于监督学习?()

A.聚类算法

B.回归算法

C.降维算法

D.关联规则算法

8.数据挖掘的主要任务不包括()

A.分类

B.预测

C.数据存储

D.关联规则挖掘

9.以下哪种数据库适合存储大数据?()

A.Oracle

B.MySQL

C.MongoDB

D.SQLServer

10.在Hadoop生态系统中,用于分布式计算的框架是()

A.HDFS

B.MapReduce

C.HBase

D.Spark

二、多项选择题(每题2分,共10题)

1.以下属于数据预处理步骤的有()

A.数据集成

B.数据归约

C.数据变换

D.数据挖掘

2.常用的数据分析方法包括()

A.描述性分析

B.探索性分析

C.预测性分析

D.规范性分析

3.数据可视化的原则有()

A.简洁明了

B.准确传达信息

C.美观易读

D.突出重点

4.关联规则的评价指标有()

A.支持度

B.置信度

C.提升度

D.准确率

5.决策树的构成要素包括()

A.根节点

B.内部节点

C.叶节点

D.分支

6.机器学习中的模型评估指标有()

A.准确率

B.召回率

C.F1值

D.均方误差

7.数据挖掘的应用领域包括()

A.市场营销

B.金融风控

C.医疗保健

D.教育

8.大数据的特点有()

A.大量

B.高速

C.多样

D.低价值密度

9.分布式文件系统的优点有()

A.高可靠性

B.高可扩展性

C.高性能

D.低成本

10.常用的聚类算法有()

A.K-Means

B.DBSCAN

C.层次聚类

D.决策树聚类

三、判断题(每题2分,共

文档评论(0)

1亿VIP精品文档

相关文档