- 3
- 0
- 约5.19千字
- 约 7页
- 2026-06-15 发布于河北
- 举报
大数据基础面试题及详细答案(接地气实战版)
一、基础概念类(必问基础)
1、你理解的大数据是什么?和传统数据最大的区别是什么?
参考答案:
大数据简单说,就是无法用传统数据库、传统工具在短时间内处理和分析的海量数据集。行业里常说的大数据4V特征,我结合实际场景理解是:数据量大、类型多、产生速度快、价值密度低。
和传统数据最大的区别有两点:
第一,传统数据大多是结构化数据,比如数据库表里的订单、用户信息,格式规整、体量可控;而大数据包含结构化、半结构化、非结构化数据,比如日志、图片、视频、文本,数据类型杂乱。
第二,传统数据处理思路是“先建模、后存数据、再分析”,容量和计算能力有限;大数据是分布式架构,靠多台机器集群协作,横向扩容就能提升存储和计算能力,专门解决海量数据处理的问题。
2、大数据的4V特征具体怎么理解?不要背书,结合场景说
参考答案:
海量(Volume):体量极大,日常TB、PB级别起步,比如电商平台每天的用户访问日志、支付日志,单日数据量就是几十上百GB,传统单机硬盘根本存不下。
高速(Velocity):数据产生和流转速度快,需要实时或秒级处理。比如直播弹幕、外卖订单、实时路况,数据持续产生,必须即时处理,不能延后批量计算。
多样(Variety):数据格式不统一。结构化的订单数据、半结构化的JSON日志、非结构化的用户评论、图片视频,都属于大数据处理范畴。
价
原创力文档

文档评论(0)