2026年国开电大大数据技术形考题库100道含答案【能力提升】.docxVIP

  • 1
  • 0
  • 约2.42万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道含答案【能力提升】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下关于数据集市的描述,正确的是?

A.数据集市是企业级统一的数据集合

B.数据集市通常面向特定业务部门或用户群体

C.数据集市的数据仅来源于单一业务系统

D.数据集市的存储结构与数据仓库完全独立

【答案】:B

解析:本题考察数据集市与数据仓库的区别。数据集市是面向部门级或特定业务需求的小型数据集合,通常从数据仓库中抽取数据;数据仓库才是企业级统一数据集合(排除A);数据集市的数据可来源于数据仓库(排除C);数据集市的存储结构与数据仓库类似但规模更小(排除D)。因此正确答案为B。

2、Hadoop生态系统中,负责分布式计算任务执行的核心框架是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:B

解析:MapReduce是Hadoop分布式计算框架,专门用于处理海量数据的并行计算任务;HDFS是分布式存储系统,仅负责数据存储;YARN是资源管理系统,不直接执行计算;Hive是数据仓库工具,基于SQL语法操作数据。因此正确答案为B。

3、在数据挖掘任务中,用于发现数据对象相似性并分组为多个簇的技术是?

A.关联规则挖掘

B.分类

C.聚类

D.回归分析

【答案】:C

解析:本题考察数

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档