- 0
- 0
- 约2.3万字
- 约 34页
- 2026-06-23 发布于江西
- 举报
大数据分析与商业智能手册
第1章大数据基础架构与数据治理
1.1大数据核心概念与特性
大数据首先被定义为“用80个维度的特征来描述4个特征,即4V特性”,即Volume(体量)、Velocity(速度)、Variety(多样性)和Value(价值)。例如,某电商平台每日产生的交易数据量可达50亿条,这就是典型的Volume特征,若没有高并发处理能力,系统将无法支撑。速度特征表现为数据的实时采集与处理需求,以每秒10万次的数据写入为例,传统数据库只能处理1000次,而大数据系统需引入流处理框架如Flink或SparkStreaming,确保用户下单时能在毫秒级获得库存信息,否则将导致严重的超卖现象。
多样性特征涵盖结构化数据(如数据库表)、半结构化数据(如JSON日志)和非结构化数据(如图片、视频、文本),某物流平台需同时处理GPS轨迹(非结构化)和订单记录(结构化),单一架构无法覆盖,必须构建混合架构。价值特征强调数据在决策中的转化能力,通过关联分析发现用户行为与消费习惯的关联,例如分析“购买运动鞋”与“购买袜子”的时间差,从而优化库存分配,将原始数据转化为商业洞察。数据具有5V特性中,5个维度的特征包括5D特性,即数据产生速度(Speed)、数据内容(Content)、数据规模(Volume)、数据价值(
您可能关注的文档
最近下载
- 川16J116-TJ水泥基泡沫保温板建筑保温系统建筑构造.docx VIP
- DBJ33_T+1348-2025+城镇道路路桥过渡段技术规程.docx VIP
- DB54_T+0481-2025+西藏地区220kV和110kV变压器中性点+过电压间隙保护技术规范.docx VIP
- NB_T 11568.11-2024 水电工程岩土试验仪器设备校验规程 第11部分:轻型和重型击实仪.docx VIP
- T∕TAF 209.10-2024 移动互联网应用程序(APP)合规开发管理测评规范 第10部分:人员能力.docx VIP
- T∕TAF 196-2023 移动互联网金融客户端技术要求.docx VIP
- DB64∕T 2180-2026 营商环境评价基本规范.pdf VIP
- JJF(鄂) 185-2026 磁阻式磁传感器校准规范.pdf VIP
- 臭氧防控储粮霉菌技术规程编制说明.pdf
- 浦项(张家港)不锈钢股份有限公司合金熔化炉改建项目.pdf VIP
原创力文档

文档评论(0)