- 3
- 0
- 约2.78万字
- 约 40页
- 2026-06-17 发布于江西
- 举报
大数据课程与资源手册
第1章大数据概论与理论基础
1.1大数据时代的演进历程
回顾1980年代,数据主要指存储在硬磁盘上的结构化文本文件,如财务凭证和人事档案,其特点是数量少且易于处理。进入2000年代,随着互联网普及,数据开始以网页形式存在,形成了非结构化的文本和图像,但数据量仍难以支撑深度分析。
2008年,Google提出3V特征(Volume规模、Velocity速度、Variety多样性),标志着数据开始被视为一种新的生产要素。2010年后,云计算和Hadoop生态系统的成熟,使得海量数据的存储与计算能力得以突破,大数据概念正式进入主流视野。2013年,Facebook发布4V理论,在Volume基础上增加了Value价值,强调数据需经过挖掘才能产生商业价值。
进入2018年至今,()与大模型的结合,使得数据分析不再仅仅是报表,而是具备预测、和自主决策能力。
1.2大数据核心特征解释
数据规模(Volume)是指数据量的巨大性,例如亚马逊一天产生的日志数据可达500TB,远超传统数据库的存储上限。数据速度(Velocity)强调数据产生的快与处理的速度,如电商订单每秒可能产生数十条,要求系统具备毫秒级响应能力。
数据种类(Variety)涵盖结构化数据(如SQL表)、半结构化数据(如JSON格式)和非结
您可能关注的文档
最近下载
- DLT 5054-1996 火力发电厂汽水管道设计技术规定.doc VIP
- 黑龙江省2026年高考生物试卷(含答案及解析).pdf
- DGJ32-TJ204-2016 复合材料保温板外墙外保温系统应用技术规程_可搜索.pdf
- 2025-2026学年广西南宁市天桃实验学校上学期九年级数学开学考试卷.doc VIP
- 2024年长沙市开福区事业单位招聘真题.docx VIP
- 广西南宁市天桃实验学校2024-2025学年七年级上学期开学分班考英语试题(含解析).docx VIP
- 浙教版小学数学五年级下册知识点思维导图(可打印).pdf
- 2016-2020年成人高考《高起点英语》考试真题合集(含解析).pdf VIP
- 暑假五升六衔接专项训练 阅读选择 (二) (试题) 人教PEP版小学英语五年级下册(含答案).docx VIP
- 广西南宁市天桃实验学校2024-2025学年七年级上学期开学分班考语文试题.docx VIP
原创力文档

文档评论(0)