2026年国开电大大数据技术形考题库100道及答案【夺冠】.docxVIP

  • 1
  • 0
  • 约2.45万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及答案【夺冠】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、下列算法中,常用于大数据分类任务的是?

A.K-Means聚类算法

B.Apriori关联规则算法

C.支持向量机(SVM)

D.PCA主成分分析算法

【答案】:C

解析:本题考察数据挖掘算法类型知识点。支持向量机(SVM)是典型的有监督分类算法;K-Means是无监督聚类算法,Apriori用于关联规则挖掘(无监督),PCA用于降维(特征工程),因此答案为C。

2、在大数据分析流程中,数据清洗的主要目的是?

A.将多源数据合并为统一格式

B.处理缺失值、异常值以保证数据质量

C.降低数据维度减少计算量

D.转换数据格式以适配分析工具

【答案】:B

解析:本题考察数据预处理步骤。数据清洗是大数据分析前的关键环节,核心任务是处理数据中的噪声(如缺失值、异常值)和不一致性;A选项对应数据集成;C选项对应数据规约;D选项对应数据转换。因此正确答案为B。

3、在大数据实时数据处理中,用于构建高吞吐、低延迟的消息系统的开源框架是?

A.Flume(日志采集工具)

B.Sqoop(数据导入导出工具)

C.Kafka(分布式消息队列)

D.Hive(数据仓库工具)

【答案】:C

解析:本题考察大数据生态工具知识点。Kafka是高吞吐、低延迟的分布式消息系统,适用于实时数据流处理;Flum

文档评论(0)

1亿VIP精品文档

相关文档