大数据分析与应用手册
第1章大数据概述与理论基础
1.1大数据定义与特征
传统数据库主要基于关系型模型,强调数据的结构化与一致性,而大数据则是指具有海量性、高速性、多样性、价值性和真实性五大特征的异构数据集合,其核心在于处理传统计算机难以处理的复杂数据场景。海量性是指大数据规模远超传统存储与计算能力,通常以PB甚至EB的级别衡量,例如某电商平台每日产生的日志数据可能达到数十TB,而用户行为记录可能达到PB级别。
高速性指数据产生、传输和处理的速度极快,要求系统具备毫秒级的响应能力,如实时流处理平台需对每秒10万条以上的传感器数据进行实时清洗与分析。多样性涵盖数
原创力文档

文档评论(0)