- 2
- 0
- 约1.14万字
- 约 12页
- 2026-05-25 发布于河北
- 举报
大数据挖掘面试题及详细答案
一、基础必考题(入门级,考察核心概念掌握)
1.请解释什么是大数据挖掘?它和数据分析的区别是什么?
答案:大数据挖掘是从海量、多类型、高速产生的数据中,通过算法发现隐藏在数据里的规律、关联、异常或趋势,核心是“从数据中找未知的价值”,比如通过用户行为数据挖掘潜在消费需求,不是简单的数据统计。
和数据分析的核心区别的是:数据分析更偏向“已知问题找答案”,比如“这个月销量下降的原因是什么”,主要用统计、可视化工具分析已有数据,验证预设结论;而数据挖掘是“未知问题找方向”,不需要预设结论,是从无到有挖掘数据背后的隐藏信息,比如挖掘“哪些用户大概率会流失”,为决策提供新的参考。
简单说,数据分析是“解读数据”,数据挖掘是“发现数据”,两者常结合使用,挖掘的结果需要通过数据分析进一步验证和落地。
2.大数据的5V特征是什么?请简要解释每个特征的实际意义
答案:大数据的5V特征是Volume(海量性)、Velocity(高速性)、Variety(多样性)、Value(价值密度低)、Veracity(真实性),每个特征的实际意义结合业务场景说明,不搞纯理论:
1.Volume(海量性):数据规模极大,比如电商平台一天的用户行为日志(点击、浏览、下单)可达TB甚至PB级,这就要求数据挖掘工具必须支持海量数据的存储和计算,不能用传统的单机数据库。
2.Velo
原创力文档

文档评论(0)