大数据分析试卷及详解.docxVIP

  • 2
  • 0
  • 约9.61千字
  • 约 25页
  • 2026-06-17 发布于上海
  • 举报

大数据分析试卷及详解

一、单项选择题(共10题,每题1分,共10分)

以下选项中,不属于大数据经典4V核心特征的是

A.Volume指代数据的整体体量规模巨大

B.Velocity指代数据的产生和处理速度快

C.Variety指代数据的来源和类型丰富多元

D.Value指代单条数据的平均价值密度极高

答案:D

解析:大数据4V特征里的Value维度指的是大数据整体价值很高,但单条数据的平均价值密度极低,比如大量监控视频里只有几秒的有效线索。A、B、C三个选项的描述完全符合4V各维度的准确定义,只有D选项的表述和知识点完全相悖。

大数据分析流程中,数据预处理阶段的核心目标不包含以下哪一项

A.修正原始数据中存在的错误和缺失值

B.剔除完全重复的无效数据记录

C.直接将所有原始数据同步对外公开

D.统一不同来源数据的字段命名和格式

答案:C

解析:数据预处理的所有操作都是为了提升后续分析的数据质量,绝对不涉及将原始数据直接对外公开的环节,该行为也会违反数据隐私相关规范。A、B、D都是数据预处理阶段的典型操作内容,符合流程要求。

以下分布式文件存储系统中,专门为大数据场景下海量非结构化数据存储设计的主流开源组件是

A.普通单机Excel表格

B.Hadoop分布式文件系统

C.单机关系型数据库

D.本地桌面文档文件夹

答案:B

解析:Hadoop分布式文件系统是大

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档