大数据分析与数据挖掘手册(执行版).docx

大数据分析与数据挖掘手册(执行版).docx

大数据分析与数据挖掘手册(执行版)

第1章绪论与基础概念

1.1大数据的定义与特征

大数据(BigData)被定义为无法通过传统数据库管理系统进行传统数据分析的数据集合,其核心特征常被概括为“3V,即Volume(数据量巨大)、Velocity(数据产生和处理速度极快)和Variety(数据类型繁多且异构)。例如,在电商场景中,一个用户一天的日志可能包含数千万条记录,且这些数据以JSON、CSV、图片等多种格式并存,远超传统关系型数据库的存储能力。要理解Volume,可以想象一个大型互联网公司的用户行为数据,每天产生的日志量往往达到PB级别,需要分布式存储技术如HD

文档评论(0)

1亿VIP精品文档

相关文档