大数据分析师试题及解析.docxVIP

  • 2
  • 0
  • 约1.19万字
  • 约 29页
  • 2026-06-17 发布于上海
  • 举报

大数据分析师试题及解析

一、单项选择题(共10题,每题1分,共10分)

以下不属于大数据经典4V核心特征的选项是

A.数据价值密度极高

B.数据规模体量巨大

C.数据生成与处理速度快

D.数据类型包含结构化、半结构化与非结构化多种形态

答案:A

解析:大数据4V特征分别对应大体量(Volume)、高速度(Velocity)、多类型(Variety)、低价值密度(Value),真实场景下大数据单条有效数据的价值占比极低,并不存在价值密度极高的特点,因此A选项表述错误;其余三个选项均是4V体系中明确覆盖的核心特征,表述正确。

数据清洗环节中针对完全重复的行数据,最常规的处理操作是

A.直接全部保留

B.执行去重操作仅保留单条有效记录

C.随机删除任意一条

D.将重复数据全部标记为异常值丢弃

答案:B

解析:完全重复的行数据没有额外的分析价值,占用存储资源还会干扰统计结果,常规处理方式是通过主键或全字段匹配完成去重,仅保留单条有效记录,B选项正确;A选项全部保留会放大统计指标结果,造成数据虚高;C选项随机删除存在漏删或误删风险,没有规范依据;D选项直接全部丢弃会连唯一的有效记录也一并删除,造成数据损失,三个选项操作均不规范。

统计分析中常用的中位数指标,核心作用是

A.放大极端值对整体统计结果的影响

B.消除极端值对整体统计结果的干扰,反映数据的中间水平

C.精准计

文档评论(0)

1亿VIP精品文档

相关文档