- 1
- 0
- 约2.45万字
- 约 38页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、下列算法中,常用于大数据分类任务的是?
A.K-Means聚类算法
B.Apriori关联规则算法
C.支持向量机(SVM)
D.PCA主成分分析算法
【答案】:C
解析:本题考察数据挖掘算法类型知识点。支持向量机(SVM)是典型的有监督分类算法;K-Means是无监督聚类算法,Apriori用于关联规则挖掘(无监督),PCA用于降维(特征工程),因此答案为C。
2、在大数据分析流程中,数据清洗的主要目的是?
A.将多源数据合并为统一格式
B.处理缺失值、异常值以保证数据质量
C.降低数据维度减少计算量
D.转换数据格式以适配分析工具
【答案】:B
解析:本题考察数据预处理步骤。数据清洗是大数据分析前的关键环节,核心任务是处理数据中的噪声(如缺失值、异常值)和不一致性;A选项对应数据集成;C选项对应数据规约;D选项对应数据转换。因此正确答案为B。
3、在大数据实时数据处理中,用于构建高吞吐、低延迟的消息系统的开源框架是?
A.Flume(日志采集工具)
B.Sqoop(数据导入导出工具)
C.Kafka(分布式消息队列)
D.Hive(数据仓库工具)
【答案】:C
解析:本题考察大数据生态工具知识点。Kafka是高吞吐、低延迟的分布式消息系统,适用于实时数据流处理;Flum
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道及一套答案.docx
- 2026年国开电大当代中国政治制度形考题库100道附完整答案【名校卷】.docx
- 2026年国开电大当代中国政治制度形考题库100道【考点精练】.docx
- 2026年国开电大当代世界经济与政治形考题库100道带答案(完整版).docx
- 2026年国开电大当代世界经济与政治形考题库100道及参考答案(预热题).docx
- 2026年国开电大导游业务形考题库100道附答案【预热题】.docx
- 2026年国开电大导游业务形考题库100道及答案【全国通用】.docx
- 2026年国开电大大数据技术概论形考题库100道(必刷).docx
- 2026年国开电大大数据技术概论形考题库100道及1套完整答案.docx
- 2026年国开电大大数据技术形考题库100道附参考答案【黄金题型】.docx
原创力文档

文档评论(0)