大数据常用面试题及详细答案.docxVIP

  • 3
  • 0
  • 约1.13万字
  • 约 12页
  • 2026-04-16 发布于河北
  • 举报

大数据常用面试题及详细答案

一、基础概念类(必问,考察基础扎实度)

1.什么是大数据?大数据的核心特征是什么?

问题解析:避免背定义,结合实际场景说清楚,核心是区分大数据与传统数据的差异,不堆砌专业术语。

详细答案:大数据不是简单的“数据量大”,而是指无法用传统的数据库软件(比如MySQL)在规定时间内完成采集、存储、分析和处理的数据集合。核心特征就是常说的5V(不用死记,理解每个特征的实际意义):

1.海量性(Volume):数据量规模极大,从TB级跃升到PB级、EB级,比如电商平台一天的用户行为数据、短视频平台的视频播放日志,都是海量数据;

2.高速性(Velocity):数据产生和处理的速度极快,要求实时或准实时响应,比如滴滴的实时派单、抖音的实时推荐,数据一秒钟可能产生几十万条,必须快速处理;

3.多样性(Variety):数据类型多,不只是传统的结构化数据(比如数据库里的表格数据),还有非结构化数据(图片、视频、音频)、半结构化数据(JSON、XML、日志文件),比如用户的评论、头像、浏览轨迹,类型杂乱;

4.价值性(Value):数据本身价值密度低,需要从海量杂乱的数据中挖掘有用的信息,比如从千万条用户日志里,找出用户的消费习惯,指导平台做推荐,这就是价值提炼;

5.真实性(Veracity):数据来源复杂,存在噪声、异常值,比如用户误点的操作日

文档评论(0)

1亿VIP精品文档

相关文档