2026年国开电大大数据技术形考题库100道及答案【夺冠】.docxVIP

2026年国开电大大数据技术形考题库100道及答案【夺冠】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、下列算法中，常用于大数据分类任务的是？

A.K-Means聚类算法

B.Apriori关联规则算法

C.支持向量机（SVM）

D.PCA主成分分析算法

【答案】：C

解析：本题考察数据挖掘算法类型知识点。支持向量机（SVM）是典型的有监督分类算法；K-Means是无监督聚类算法，Apriori用于关联规则挖掘（无监督），PCA用于降维（特征工程），因此答案为C。

2、在大数据分析流程中，数据清洗的主要目的是？

A.将多源数据合并为统一格式

B.处理缺失值、异常值以保证数据质量

C.降低数据维度减少计算量

D.转换数据格式以适配分析工具

【答案】：B

解析：本题考察数据预处理步骤。数据清洗是大数据分析前的关键环节，核心任务是处理数据中的噪声（如缺失值、异常值）和不一致性；A选项对应数据集成；C选项对应数据规约；D选项对应数据转换。因此正确答案为B。

3、在大数据实时数据处理中，用于构建高吞吐、低延迟的消息系统的开源框架是？

A.Flume（日志采集工具）

B.Sqoop（数据导入导出工具）

C.Kafka（分布式消息队列）

D.Hive（数据仓库工具）

【答案】：C

解析：本题考察大数据生态工具知识点。Kafka是高吞吐、低延迟的分布式消息系统，适用于实时数据流处理；Flum

更多 >