2026年国开电大大数据技术概论形考题库100道及完整答案【考点梳理】.docxVIP

下载本文档

0
0
约2.47万字
约 39页
2026-03-09 发布于河南
举报

2026年国开电大大数据技术概论形考题库100道及完整答案【考点梳理】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪项是大数据在“精准营销”领域的典型应用？

A.智能交通系统实时监控城市路况

B.电商平台根据用户历史行为推荐商品

C.医院利用电子病历数据辅助诊断疾病

D.金融机构实时监测交易异常行为防范风险

【答案】：B

解析：本题考察大数据应用场景。选项B中电商平台通过用户浏览、购买记录等行为数据构建用户画像，实现个性化推荐，直接体现“精准营销”；选项A属于“智慧城市-交通管理”，选项C属于“精准医疗”，选项D属于“金融风控”，均与精准营销无关。

2、在大数据应用中，为保护用户隐私而对敏感数据进行匿名化处理的技术是？

A.数据加密

B.数据压缩

C.数据清洗

D.数据脱敏

【答案】：D

解析：本题考察大数据安全技术。数据加密是对数据编码防止未授权访问；数据压缩用于减少存储；数据清洗是去除噪声和错误数据；数据脱敏通过变形处理敏感信息（如隐藏手机号中间四位），既保留数据可用性又保护隐私，是隐私保护的核心技术。因此正确答案为D。

3、在大数据处理流程中，对数据进行去重、填补缺失值、处理异常值等操作属于以下哪个环节？

A.数据集成

B.数据清洗

C.数据转换

D.数据规约

【答案】：B

解析：本题考察大数据预处理环节知识点。数据清洗是预处理的核心步骤，主要通过去重、填补缺失值、处理异常值等操作提升数据质量；数据集成是合并多源数据，数据转换是调整数据格式/范围，数据规约是压缩数据规模。因此正确答案为B。

4、以下哪种计算模式适用于实时或近实时处理流数据？

A.批处理（如MapReduce）

B.流处理（如SparkStreaming）

C.离线计算（如Hive查询）

D.预计算（如HBase扫描）

【答案】：B

解析：本题考察大数据处理的计算模式。流处理（如SparkStreaming、Flink）专门针对实时或近实时流数据（如日志、传感器数据）进行低延迟处理；A选项批处理（MapReduce）适用于历史数据的批量计算；C选项离线计算（Hive）依赖预加载数据，处理周期较长；D选项预计算（HBase）是存储层的快速查询，不属于计算模式。因此正确答案为B。

5、Hadoop生态系统中用于存储海量数据的分布式文件系统是？

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】：A

解析：本题考察Hadoop核心组件知识点。HDFS（HadoopDistributedFileSystem）是Hadoop生态系统的分布式文件系统，负责海量数据的存储；MapReduce是分布式计算框架，YARN是资源管理器，Hive是基于Hadoop的数据仓库工具。因此正确答案为A。

6、Hadoop生态系统中，哪个组件负责分布式文件存储，是大数据存储的核心基础？

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】：B

解析：本题考察Hadoop生态系统组件功能知识点。正确答案为B。解析：HDFS（分布式文件系统）是Hadoop的核心组件之一，基于分布式架构实现海量数据的可靠存储；A选项MapReduce是分布式计算框架，负责并行处理海量数据；C选项YARN是资源管理器，负责集群资源调度；D选项Hive是基于Hadoop的数据仓库工具，用于数据查询和分析。因此B为正确选项。

7、以下哪种数据库属于非关系型数据库（NoSQL）？

A.MySQL

B.MongoDB

C.Oracle

D.SQLServer

【答案】：B

解析：本题考察数据库类型。关系型数据库（RDBMS）基于SQL和二维表结构，如MySQL、Oracle、SQLServer均为关系型数据库。MongoDB是文档型NoSQL数据库，采用非结构化JSON文档存储，无需预定义表结构，属于非关系型数据库，因此正确答案为B。

8、在Hadoop生态系统中，负责分布式文件存储的核心组件是？

A.MapReduce（分布式计算框架）

B.YARN（资源管理器）

C.HDFS（分布式文件系统）

D.Hive（数据仓库工具）

【答案】：C

解析：本题考察Hadoop生态系统组件知识点。HDFS（HadoopDistributedFileSystem）是Hadoop的分布式文件系统，专门用于存储海量数据；MapReduce是分布式计算框架，负责并行处理数据；YARN负责集群资源的分配与调度；Hive是基于Hadoop的SQL查询工具，用于数据仓库构建。因此正确答案为C。

9、在大数据处理流程中，‘数据清洗、数据转换、数据集成’属于哪个阶段？

A.数据采集阶段

B.数据预处理阶段

C.数据存储

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年国开电大大数据技术概论形考题库100道及完整答案【考点梳理】.docxVIP