大数据基础面试题及详细答案(接地气实战版).docxVIP

  • 3
  • 0
  • 约5.19千字
  • 约 7页
  • 2026-06-15 发布于河北
  • 举报

大数据基础面试题及详细答案(接地气实战版).docx

大数据基础面试题及详细答案(接地气实战版)

一、基础概念类(必问基础)

1、你理解的大数据是什么?和传统数据最大的区别是什么?

参考答案:

大数据简单说,就是无法用传统数据库、传统工具在短时间内处理和分析的海量数据集。行业里常说的大数据4V特征,我结合实际场景理解是:数据量大、类型多、产生速度快、价值密度低。

和传统数据最大的区别有两点:

第一,传统数据大多是结构化数据,比如数据库表里的订单、用户信息,格式规整、体量可控;而大数据包含结构化、半结构化、非结构化数据,比如日志、图片、视频、文本,数据类型杂乱。

第二,传统数据处理思路是“先建模、后存数据、再分析”,容量和计算能力有限;大数据是分布式架构,靠多台机器集群协作,横向扩容就能提升存储和计算能力,专门解决海量数据处理的问题。

2、大数据的4V特征具体怎么理解?不要背书,结合场景说

参考答案:

海量(Volume):体量极大,日常TB、PB级别起步,比如电商平台每天的用户访问日志、支付日志,单日数据量就是几十上百GB,传统单机硬盘根本存不下。

高速(Velocity):数据产生和流转速度快,需要实时或秒级处理。比如直播弹幕、外卖订单、实时路况,数据持续产生,必须即时处理,不能延后批量计算。

多样(Variety):数据格式不统一。结构化的订单数据、半结构化的JSON日志、非结构化的用户评论、图片视频,都属于大数据处理范畴。

文档评论(0)

1亿VIP精品文档

相关文档