- 2
- 0
- 约5.3千字
- 约 15页
- 2026-04-28 发布于四川
- 举报
2026年大数据知识试题及答案
一、单项选择题(每题2分,共20分)
1.以下哪项不属于非结构化数据?
A.社交媒体评论
B.传感器实时数据流
C.关系型数据库表记录
D.监控视频文件
答案:C(解析:关系型数据库表记录是结构化数据,具有预定义的模式和行列结构;其他选项为非结构化或半结构化数据。)
2.关于Hadoop生态中HBase的描述,正确的是?
A.基于行存储的分布式数据库
B.适合实时随机读写场景
C.仅支持SQL查询
D.数据模型为键值对,无列族概念
答案:B(解析:HBase是基于列族存储的分布式NoSQL数据库,支持实时随机读写;数据模型包含行键、列族、时间戳;查询方式包括API和PhoenixSQL。)
3.以下哪项是SparkRDD的特性?
A.不可变、可分区、支持内存计算
B.支持事务ACID特性
C.默认存储在磁盘中
D.仅支持窄依赖操作
答案:A(解析:RDD是弹性分布式数据集,不可变且可分区,支持内存计算以提升性能;SparkSQL的DataFrame/Dataset支持部分ACID;RDD默认根据持久化策略存储;RDD支持窄依赖(如map)和宽依赖(如shuffle)操作。)
4.数据湖(DataLake)与数据仓库(DataWarehouse)的核心区别是?
A.数据湖存储结构化数据,数据仓库存储非结构化数据
B.
您可能关注的文档
- 《浙江省化工园区废气治理专业技术指导原则(试行)》.docx
- 《浙江省林业资源动态监测调查技术规程(试行)》.docx
- 《真实世界证据支持药品注册指导原则(试行)》.docx
- 《征信异议处理流程闭环办理规程(试行)》.docx
- 《政府采购项目履约验收统一技术规范(试行版)》发布.docx
- 《政府购买服务项目履约验收技术标准(试行)》.docx
- 《政府机关涉密文件丢失应急处置实施导则 (试行)》.docx
- 《政府信息公开泄密事件应急处置实施导则 (试行)》.docx
- 《政府专项资金拨付绩效考评规范(试行版)》印发.docx
- 《政企数据对接合规抽查要点及风险判定(试行)》.docx
- 统编版小学五年级语文下册课件《语文园地六》.pptx
- 9.3 大气压强 课件-2025-2026学年人教版物理八年级下学期.pptx
- 10.《苏武传》第二课时 课件 2026-2027学年统编版高二语文选择性必修中册.pptx
- 统编版小学五年级语文下册课件《第二单元习作:写读后感》.pptx
- 2025-2026学年初二英语下学期期中模拟练习含答案.docx
- 2024-2025学年广东省广州市八年级下学期中段生物检测含答案.docx
- 2024-2025学年广东广州天河中学八年级下学期期中数学试题含答案.docx
- 冀教版八年级数学上《第十二章分式和分式方程》单元测试含答案.doc
- 华东师大八年级数学下《第18章平行四边形》整合提升试卷.doc
- 危重病人生命体征监测.pptx
原创力文档

文档评论(0)