2026年国开电大大数据技术概论形考题库100道【综合题】.docxVIP

  • 0
  • 0
  • 约2.49万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道【综合题】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在Hadoop生态系统中,负责分布式计算任务调度与执行的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。HDFS是分布式存储组件,负责数据存储;MapReduce是分布式计算框架,核心功能是任务调度与执行;YARN是资源管理器,负责集群资源管理;ZooKeeper是分布式协调服务。因此正确答案为B。

2、以下哪种数据采集方式属于被动式数据采集?

A.用户主动填写调查问卷

B.系统自动记录用户登录日志

C.用户手动上传数据文件

D.用户在社交媒体主动发布内容

【答案】:B

解析:本题考察数据采集方式知识点。被动式数据采集指系统或设备自动捕获数据,无需用户主动操作。选项B“系统自动记录用户登录日志”属于被动采集;A、C、D均需用户主动参与,属于主动式数据采集。因此正确答案为B。

3、大数据处理流程中,首先需要执行的关键步骤是以下哪一项?

A.数据存储(将数据持久化到存储系统)

B.数据采集(从各类数据源获取原始数据)

C.数据清洗(去除数据中的噪声和异常值)

D.数据挖掘(从数据中提取有价值信息)

【答

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档