- 2
- 0
- 约1.19万字
- 约 29页
- 2026-06-17 发布于上海
- 举报
大数据分析师试题及解析
一、单项选择题(共10题,每题1分,共10分)
以下不属于大数据经典4V核心特征的选项是
A.数据价值密度极高
B.数据规模体量巨大
C.数据生成与处理速度快
D.数据类型包含结构化、半结构化与非结构化多种形态
答案:A
解析:大数据4V特征分别对应大体量(Volume)、高速度(Velocity)、多类型(Variety)、低价值密度(Value),真实场景下大数据单条有效数据的价值占比极低,并不存在价值密度极高的特点,因此A选项表述错误;其余三个选项均是4V体系中明确覆盖的核心特征,表述正确。
数据清洗环节中针对完全重复的行数据,最常规的处理操作是
A.直接全部保留
B.执行去重操作仅保留单条有效记录
C.随机删除任意一条
D.将重复数据全部标记为异常值丢弃
答案:B
解析:完全重复的行数据没有额外的分析价值,占用存储资源还会干扰统计结果,常规处理方式是通过主键或全字段匹配完成去重,仅保留单条有效记录,B选项正确;A选项全部保留会放大统计指标结果,造成数据虚高;C选项随机删除存在漏删或误删风险,没有规范依据;D选项直接全部丢弃会连唯一的有效记录也一并删除,造成数据损失,三个选项操作均不规范。
统计分析中常用的中位数指标,核心作用是
A.放大极端值对整体统计结果的影响
B.消除极端值对整体统计结果的干扰,反映数据的中间水平
C.精准计
您可能关注的文档
- 中学体育田径训练试卷及详解.docx
- 乒乓球发球旋转的生物力学测量.docx
- 人像摄影师试题及解析.docx
- 人造草坪铺装工程合同.docx
- 企业新产品研发计划.docx
- 众包模式的“责任承担”法律框架.docx
- 停工留薪期工资的计算基数.docx
- 军事改革题库及解析.docx
- 农村合作社发展计划.docx
- 制造业供应商协同管理平台建设方案.docx
- 康复护理中的营养支持技术.pptx
- 批次03-04_2025-2026学年苏州市七年级语文下册期末质量检测原创仿真模拟试卷第001套.docx
- 批次03-03_2026届上海市闵行区六年级英语小升初分班考试模拟试卷第001套.docx
- 水域救援指南..docx
- 批次03-05_2026届成都市高一历史学业水平合格性考试原创仿真模拟试卷第001套.docx
- 批次03-01_2026届广州市白云区六年级数学小升初分班考试模拟试卷第001套.docx
- 批次03-02_2026届广州市越秀区八年级生物学业水平考试考前仿真模拟试卷第001套.docx
- 27_2026杭州新七年级英语暑假衔接学情诊断A卷.docx
- 2025-2026学年吉林省长春市第七十二中学八年级(下)期中道德与法治试卷(含答案).docx
- 2025-2026学年江苏省苏州市振华中学七年级(下)期中道德与法治试卷(含答案).docx
原创力文档

文档评论(0)