- 3
- 0
- 约1.25万字
- 约 12页
- 2026-05-25 发布于河北
- 举报
大数据面试题及详细答案
一、基础必考题(入门级,必问)
1.请说说什么是大数据?大数据的核心特征有哪些?
问题解析:考察对大数据基础概念的理解,避免背诵书本定义,要结合实际场景说明,体现认知深度。
详细答案:大数据不是简单的“大量数据”,而是指无法用传统的数据库工具(比如MySQL)在规定时间内完成采集、存储、分析和处理的数据集合。它的核心价值是通过对海量、多类型的数据进行挖掘,提取有价值的信息,支撑决策(比如电商的用户推荐、互联网的风控分析)。
核心特征常用“5V”来概括,结合实际场景解释更易理解:
Volume(海量性):数据规模极大,从TB级跃升到PB级甚至EB级,比如某短视频平台一天的用户行为数据就可达PB级。
Velocity(高速性):数据产生和处理的速度极快,要求实时或准实时响应,比如直播平台的弹幕实时统计、金融交易的实时风控。
Variety(多样性):数据类型复杂,不再是单一的结构化数据(比如数据库里的表格数据),还包括非结构化数据(图片、视频、音频)和半结构化数据(JSON、XML),比如社交平台的用户评论(文本)、头像(图片)、语音消息(音频)。
Veracity(真实性):数据来源杂乱,存在噪声、冗余和虚假信息,比如用户填写的虚假个人信息、爬虫抓取的重复数据,需要经过清洗才能使用。
Value(低价值密度):海量数据中,有价值的信息占比极低,比如监控视频
原创力文档

文档评论(0)