2026年国开电大大数据技术概论形考题库100道带答案(培优).docxVIP

  • 0
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道带答案(培优).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的5V特征中,不包括以下哪一项?

A.Variety(多样性)

B.Velocity(速度)

C.Value(价值)

D.Viscosity(粘度)

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据的5V特征标准定义为Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值),而“Viscosity(粘度)”并非大数据特征范畴,属于干扰项。因此正确答案为D。

2、Hadoop分布式计算框架的核心计算模型是以下哪一项?

A.MapReduce

B.YARN

C.HDFS

D.ZooKeeper

【答案】:A

解析:本题考察Hadoop生态系统核心组件。正确答案为A:MapReduce是Hadoop的核心计算模型,通过Map和Reduce阶段实现分布式并行计算。B选项YARN是资源管理器,负责集群资源调度;C选项HDFS是分布式文件系统,用于存储海量数据;D选项ZooKeeper是分布式协调服务,提供一致性管理。因此MapReduce是核心计算框架,答案为A。

3、下列哪项属于大数据在精准医疗领域的应用?

A.基于用户浏览历史的商品推荐

B.通过分析基因数据预测疾病风险

C.实时监控城市交通流量

D.优化电商物流配送路径

【答案】:B

解析:本题考察大数据应用场景知识点。精准医疗通过分析基因、病历等多维度数据预测疾病风险,属于大数据在医疗领域的典型应用;A选项是电商智能推荐(用户画像应用);C选项是智慧城市交通监控(物联网+大数据);D选项是物流路径优化(供应链管理应用)。因此正确答案为B。

4、以下哪项属于大数据数据挖掘的典型应用?

A.对某电商平台用户历史订单数据进行统计描述

B.利用机器学习算法对客户数据进行分类,识别潜在高价值客户

C.对企业内部财务报表数据进行录入和整理

D.使用Excel对销售数据进行简单求和计算

【答案】:B

解析:本题考察数据挖掘应用知识点。数据挖掘是从大量数据中提取隐含、未知、有价值信息的过程。选项A是基础统计描述,属于数据分析;选项C是数据录入,不属于挖掘;选项D是简单计算,也不属于挖掘。选项B通过机器学习算法对客户数据分类,符合数据挖掘的定义,因此正确答案为B。

5、在大数据处理流程中,以下哪项属于数据清洗的主要任务?

A.数据格式转换

B.识别并处理缺失值

C.数据存储到分布式数据库

D.对数据进行可视化分析

【答案】:B

解析:本题考察大数据数据预处理阶段的“数据清洗”知识点。数据清洗的核心是处理原始数据中的噪声和错误,包括识别并处理缺失值、异常值、重复值等。A选项“数据格式转换”属于数据转换阶段;C选项“存储到分布式数据库”属于数据存储阶段;D选项“可视化分析”属于数据展示与分析阶段,均不属于数据清洗任务。因此正确答案为B。

6、以下哪个工具常用于大数据的可视化分析?

A.Tableau

B.Hadoop

C.Spark

D.Hive

【答案】:A

解析:本题考察大数据可视化工具的应用。Tableau是专业的商业智能和数据可视化工具,支持复杂数据的交互式分析与图表生成;B选项Hadoop是分布式存储与计算框架,不具备可视化功能;C选项Spark是分布式计算引擎,用于数据处理;D选项Hive是数据仓库工具,用于数据查询,因此正确答案为A。

7、以下哪种数据采集方式属于被动式数据采集?

A.用户主动填写调查问卷

B.系统自动记录用户登录日志

C.用户手动上传数据文件

D.用户在社交媒体主动发布内容

【答案】:B

解析:本题考察数据采集方式知识点。被动式数据采集指系统或设备自动捕获数据,无需用户主动操作。选项B“系统自动记录用户登录日志”属于被动采集;A、C、D均需用户主动参与,属于主动式数据采集。因此正确答案为B。

8、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Validity(有效性)

【答案】:D

解析:本题考察大数据的核心特征(4V)知识点。大数据的4V特征是指Volume(数据量)、Velocity(数据产生速度)、Variety(数据多样性)和Value(数据价值),而Validity(有效性)并非4V特征之一。因此正确答案为D,A、B、C均为4V特征的核心内容。

9、在大数据分析流程中,用于处理数据中的重复记录和异常值的步骤是?

A.数据清洗

B.数据集成

C.数据转换

D.数据归约

【答案】:A

解析:本题考察大数据预处理步骤的定义。数据清洗

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档