2026年国开电大大数据技术形考题库100道及答案【典优】.docxVIP

  • 0
  • 0
  • 约2.5万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及答案【典优】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪项属于数据预处理中处理缺失值的常用方法?

A.均值插值法(如均值、中位数填充)

B.分类算法(如决策树分类)

C.聚类算法(如K-Means聚类)

D.关联规则挖掘(如Apriori算法)

【答案】:A

解析:本题考察数据预处理方法知识点。数据预处理中处理缺失值的常用方法包括均值/中位数插值、众数填充、基于模型的预测填充等,选项A符合。而B、C、D均属于数据挖掘算法(分类、聚类、关联规则),不属于数据预处理方法。

2、以下哪种数据库类型适合存储用户社交关系网络(如微博关注关系)?

A.关系型数据库(如MySQL)

B.文档型数据库(如MongoDB)

C.列族型数据库(如HBase)

D.图数据库(如Neo4j)

【答案】:D

解析:本题考察NoSQL数据库应用场景知识点。图数据库(如Neo4j)专为处理节点与关系复杂的图结构数据设计,适合存储社交关系网络(用户为节点、关注关系为边);关系型数据库适合结构化表格数据;文档型数据库适合嵌套文档结构(如JSON);列族型数据库适合海量结构化数据(如时序数据)。因此正确答案为D。

3、大数据的特征中,体现数据产生和处理速度快的是以下哪一项?

A.Volume(数据量大)

B.Velocity(速度快)

C.Variety(数据多样性)

D.Veracity(数据真实性)

【答案】:B

解析:本题考察大数据的5V特征知识点。Volume指数据规模大,Velocity强调数据产生和处理的速度快,Variety表示数据类型多样(结构化、半结构化、非结构化),Veracity关注数据的准确性和可靠性。因此正确答案为B。

4、大数据的5V特征中,不包括以下哪一项?

A.Volume(数据容量)

B.Velocity(处理速度)

C.Viscosity(数据粘度)

D.Veracity(数据真实性)

【答案】:C

解析:本题考察大数据5V核心特征知识点,5V特征包括Volume(数据量规模)、Velocity(处理/生成速度)、Variety(数据多样性)、Value(数据价值密度)、Veracity(数据真实性)。Viscosity(粘度)并非大数据特征,属于干扰项,因此正确答案为C。

5、以下哪项属于大数据在推荐系统中的典型应用场景?

A.电商平台的商品推荐(如淘宝首页个性化商品)

B.搜索引擎的结果排序(如百度根据用户偏好排序)

C.社交媒体的个性化内容推送(如抖音/微博的信息流推荐)

D.以上都是

【答案】:D

解析:本题考察大数据推荐系统的应用场景。大数据技术在推荐系统中应用广泛:电商平台通过用户历史行为数据推荐商品(A);搜索引擎根据用户搜索习惯和偏好优化结果排序(B);社交媒体通过分析用户兴趣标签推送个性化内容(C)。因此三个选项均属于典型应用场景,正确答案为D。

6、在数据挖掘任务中,用于发现数据对象相似性并分组为多个簇的技术是?

A.关联规则挖掘

B.分类

C.聚类

D.回归分析

【答案】:C

解析:本题考察数据挖掘技术概念,聚类是将数据按相似度自动分组为不同簇(如K-Means算法);关联规则挖掘发现项间关联(如“啤酒与尿布”);分类是预测类别标签(如垃圾邮件分类);回归分析预测连续值(如房价预测)。因此正确答案为C。

7、大数据的哪个特征体现了数据产生和处理的速度要求?

A.Volume(数据量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值密度)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)特指数据产生和处理的速度要求,例如实时流数据的快速处理;Volume(A选项)指数据量大小,强调数据规模;Variety(C选项)指数据类型多样(结构化、半结构化、非结构化);Value(D选项)指数据价值密度低,需通过分析挖掘价值。因此正确答案为B。

8、Hadoop分布式文件系统HDFS的主要特点不包括以下哪项?

A.采用分块(Block)方式存储超大规模文件

B.支持高容错性,单节点故障不影响整体服务

C.适合存储和处理TB/PB级别的大文件

D.支持实时性要求高的低延迟数据写入操作

【答案】:D

解析:本题考察Hadoop分布式文件系统(HDFS)的核心特点。HDFS的设计目标是存储和处理超大规模数据,其特点包括:采用分块(默认64MB/128MB)存储大文件(选项A、C正确);通过副本机制实现高容错性(选项B正确)。而HDFS采用“一次写入,多次读取”的设计,更适合批处理场景,不支持低延迟实时写入(实时写入需其他技术如Kafk

文档评论(0)

1亿VIP精品文档

相关文档