大数据原理试卷及分析.docxVIP

  • 2
  • 0
  • 约1.22万字
  • 约 27页
  • 2026-06-03 发布于上海
  • 举报

大数据原理试卷及分析

本试卷面向高等院校大数据、计算机相关专业修完核心课程的本科生命制,覆盖大数据基础概念、分布式存储、分布式计算、数据全流程处理、安全合规等全章节考点,难度符合本科期末考核大纲要求,总分100分。

一、单项选择题(共10题,每题1分,共10分)

下列选项中,属于大数据区别于传统规模化数据最核心的本质特性是

A.数据规模达到TB级以上

B.数据类型同时包含结构化与半结构化数据

C.整体数据集合的价值密度极低

D.所有数据处理场景都要求达到毫秒级时效

答案:C

解析:正确选项依据是大数据的核心4V体系中,价值密度低是大数据独有的特征,比如几小时的监控视频中有效信息可能仅不足10秒,其余选项都不符合要求:A选项传统单机数据仓库也可以存储TB级数据,无法作为区分标志;B选项传统数据仓库很早就支持半结构化日志类数据的接入解析,不属于大数据独有特征;D选项并非所有大数据场景都要求毫秒级时效,离线批量分析场景允许小时级甚至天级的延迟,该描述本身错误。

开源分布式文件系统HDFS的生产环境默认数据块大小是

A.32MB

B.64MB

C.128MB

D.256MB

答案:C

解析:正确选项依据是当前主流版本的HDFS生产环境默认块大小为128MB,该配置可以平衡寻址开销和并行计算效率。其余选项错误点:A选项32MB是非常早期的小测试集群自定义配置的非通用值;B选项

文档评论(0)

1亿VIP精品文档

相关文档