2026年数据科学与大数据应用考试多选精讲.docxVIP

  • 2
  • 0
  • 约4.59千字
  • 约 16页
  • 2026-05-04 发布于福建
  • 举报

2026年数据科学与大数据应用考试多选精讲.docx

第PAGE页共NUMPAGES页

2026年数据科学与大数据应用考试多选精讲

一、大数据技术基础(共5题,每题2分)

1.下列哪些属于大数据的4V特征?(多选)

A.量级巨大(Volume)

B.速度快(Velocity)

C.多样性(Variety)

D.价值密度低(Veracity)

E.实时性(Variability)

2.Hadoop生态系统中的核心组件包括哪些?(多选)

A.HDFS

B.MapReduce

C.Hive

D.YARN

E.Spark

3.下列哪种存储方式适用于存储半结构化或非结构化数据?(多选)

A.关系型数据库

B.NoSQL数据库(如MongoDB)

C.列式存储(如HBase)

D.键值存储(如Redis)

E.图数据库(如Neo4j)

4.大数据采集的主要方法包括哪些?(多选)

A.日志采集

B.传感器数据采集

C.网络爬虫

D.用户输入

E.API接口

5.大数据清洗的常见任务包括哪些?(多选)

A.缺失值处理

B.异常值检测

C.数据去重

D.数据格式转换

E.数据归一化

二、数据预处理与特征工程(共6题,每题2分)

6.下列哪些属于数据预处理的基本步骤?(多选)

A.数据清洗

B.数据集成

C.数据变换

D.数据规约

E.数据分类

7.特征缩放的常用方法

文档评论(0)

1亿VIP精品文档

相关文档