大数据专业面试题及详细答案.docxVIP

  • 1
  • 0
  • 约1.1万字
  • 约 12页
  • 2026-04-29 发布于河北
  • 举报

大数据专业面试题及详细答案

一、基础理论题(入门必问,侧重理解而非背诵)

1.什么是大数据?核心特征有哪些?请用通俗的话解释,不要照搬定义。

答案:大数据本质就是“海量、多样、快速产生且有价值”的数据集合,不是单指数据多,关键是能从这些杂乱无章的数据里挖出有用的信息。比如电商平台用户的浏览、下单、收藏记录,短视频平台的观看、点赞数据,这些都是大数据。

核心特征(5V)通俗解读:

Volume(海量):数据量极大,不是MB、GB级别,而是TB、PB甚至EB级别(比如某电商一天的交易数据就可能达到TB级);

Velocity(高速):数据产生和处理速度快,比如直播时的实时弹幕、交通路口的监控数据,必须快速处理才能发挥作用;

Variety(多样):数据类型多,不只是文字、数字,还有图片、视频、音频、日志等非结构化数据;

Value(价值):数据本身价值密度低,单条数据没用,比如一条用户的浏览记录看不出什么,但千万条记录就能分析出用户喜好、消费趋势;

Veracity(真实性):数据杂乱,有噪声、有虚假信息,比如用户填写的虚假手机号、重复的日志数据,需要清洗后才能使用。

2.大数据和传统数据的核心区别是什么?

答案:最核心的区别不是“数据量大小”,而是“处理方式和价值挖掘逻辑”。

传统数据(比如企业的财务数据、客户基本信息):数据量小、结构规整(多是结构化数据),用Excel、传统

文档评论(0)

1亿VIP精品文档

相关文档