- 0
- 0
- 约2.45万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、大数据预处理阶段中,用于处理数据中的缺失值、异常值和重复数据的关键步骤是?
A.数据采集(DataCollection)
B.数据清洗(DataCleaning)
C.数据集成(DataIntegration)
D.数据转换(DataTransformation)
【答案】:B
解析:本题考察大数据预处理流程知识点。数据清洗的核心是处理数据质量问题,包括缺失值填充、异常值处理、重复数据去重等;选项A的数据采集是获取原始数据的过程,不涉及清洗;选项C的数据集成是合并多源数据,需先清洗再集成;选项D的数据转换是对数据格式、结构进行转换(如标准化),与处理缺失/异常值无关。因此,正确答案为B。
2、在大数据处理的预处理阶段,以下哪个操作主要用于处理数据中的缺失值和异常值?
A.数据清洗
B.数据集成
C.数据转换
D.数据可视化
【答案】:A
解析:本题考察数据预处理操作知识点。数据清洗是预处理的关键步骤,主要用于处理数据中的缺失值(如空值)、异常值(如离群点)、重复值等问题,确保数据质量。数据集成是合并多源数据,数据转换是对数据进行标准化、归一化等格式转换,数据可视化是结果展示,不属于预处理操作。
3、HDFS默认情况下,为每个数据块存储的副本数量是?
A.1
B.2
C.
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道带答案(轻巧夺冠).docx
- 2026年国开电大当代中国政治制度形考题库100道附完整答案【典优】.docx
- 2026年国开电大当代中国政治制度形考题库100道及答案(网校专用).docx
- 2026年国开电大当代中国政治制度形考题库100道【名校卷】.docx
- 2026年国开电大当代世界经济与政治形考题库100道含答案(突破训练).docx
- 2026年国开电大当代世界经济与政治形考题库100道【名校卷】.docx
- 2026年国开电大导游业务形考题库100道附参考答案【综合卷】.docx
- 2026年国开电大导游业务形考题库100道及答案【最新】.docx
- 2026年国开电大大数据技术概论形考题库100道带答案(培优).docx
- 2026年国开电大大数据技术概论形考题库100道及完整答案(全国通用).docx
原创力文档

文档评论(0)