2026年国开电大大数据技术概论形考题库100道及完整答案【考点梳理】.docxVIP

  • 0
  • 0
  • 约2.47万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及完整答案【考点梳理】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪项是大数据在“精准营销”领域的典型应用?

A.智能交通系统实时监控城市路况

B.电商平台根据用户历史行为推荐商品

C.医院利用电子病历数据辅助诊断疾病

D.金融机构实时监测交易异常行为防范风险

【答案】:B

解析:本题考察大数据应用场景。选项B中电商平台通过用户浏览、购买记录等行为数据构建用户画像,实现个性化推荐,直接体现“精准营销”;选项A属于“智慧城市-交通管理”,选项C属于“精准医疗”,选项D属于“金融风控”,均与精准营销无关。

2、在大数据应用中,为保护用户隐私而对敏感数据进行匿名化处理的技术是?

A.数据加密

B.数据压缩

C.数据清洗

D.数据脱敏

【答案】:D

解析:本题考察大数据安全技术。数据加密是对数据编码防止未授权访问;数据压缩用于减少存储;数据清洗是去除噪声和错误数据;数据脱敏通过变形处理敏感信息(如隐藏手机号中间四位),既保留数据可用性又保护隐私,是隐私保护的核心技术。因此正确答案为D。

3、在大数据处理流程中,对数据进行去重、填补缺失值、处理异常值等操作属于以下哪个环节?

A.数据集成

B.数据清洗

C.数据转换

D.数据规约

【答案】:B

解析:本题考察大数据预处理环节知识点。数据清洗是预处理的核心步骤,主要通过去重、填补缺失值、处理异常值等操作提升数据质量;数据集成是合并多源数据,数据转换是调整数据格式/范围,数据规约是压缩数据规模。因此正确答案为B。

4、以下哪种计算模式适用于实时或近实时处理流数据?

A.批处理(如MapReduce)

B.流处理(如SparkStreaming)

C.离线计算(如Hive查询)

D.预计算(如HBase扫描)

【答案】:B

解析:本题考察大数据处理的计算模式。流处理(如SparkStreaming、Flink)专门针对实时或近实时流数据(如日志、传感器数据)进行低延迟处理;A选项批处理(MapReduce)适用于历史数据的批量计算;C选项离线计算(Hive)依赖预加载数据,处理周期较长;D选项预计算(HBase)是存储层的快速查询,不属于计算模式。因此正确答案为B。

5、Hadoop生态系统中用于存储海量数据的分布式文件系统是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop生态系统的分布式文件系统,负责海量数据的存储;MapReduce是分布式计算框架,YARN是资源管理器,Hive是基于Hadoop的数据仓库工具。因此正确答案为A。

6、Hadoop生态系统中,哪个组件负责分布式文件存储,是大数据存储的核心基础?

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】:B

解析:本题考察Hadoop生态系统组件功能知识点。正确答案为B。解析:HDFS(分布式文件系统)是Hadoop的核心组件之一,基于分布式架构实现海量数据的可靠存储;A选项MapReduce是分布式计算框架,负责并行处理海量数据;C选项YARN是资源管理器,负责集群资源调度;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此B为正确选项。

7、以下哪种数据库属于非关系型数据库(NoSQL)?

A.MySQL

B.MongoDB

C.Oracle

D.SQLServer

【答案】:B

解析:本题考察数据库类型。关系型数据库(RDBMS)基于SQL和二维表结构,如MySQL、Oracle、SQLServer均为关系型数据库。MongoDB是文档型NoSQL数据库,采用非结构化JSON文档存储,无需预定义表结构,属于非关系型数据库,因此正确答案为B。

8、在Hadoop生态系统中,负责分布式文件存储的核心组件是?

A.MapReduce(分布式计算框架)

B.YARN(资源管理器)

C.HDFS(分布式文件系统)

D.Hive(数据仓库工具)

【答案】:C

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专门用于存储海量数据;MapReduce是分布式计算框架,负责并行处理数据;YARN负责集群资源的分配与调度;Hive是基于Hadoop的SQL查询工具,用于数据仓库构建。因此正确答案为C。

9、在大数据处理流程中,‘数据清洗、数据转换、数据集成’属于哪个阶段?

A.数据采集阶段

B.数据预处理阶段

C.数据存储

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档