- 3
- 0
- 约1.12千字
- 约 38页
- 2021-08-11 发布于河北
- 举报
大数据;目录;;;大数据时代的背景;20世纪90年代,数据仓库之父的Bill Inmon就经常提及Big Data
;全球每秒钟发送 2.9 百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5 年…
每天会有 2.88 万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3 年…
推特上每天发布 5 千万条消息,假设10 秒钟浏览一条信息,这些消息足够一个人昼夜不息的浏览16 年…
每天亚马逊上将产生 6.3 百万笔订单…
每个月网民在Facebook 上要花费7 千亿分钟,被移动互联网使用者发送和接收的数据高达1.3EB…
Google 上每天需要处理24PB 的数据…;;大数据的4V特征;大数据的构成;;;;
大数据技术将被设计用于在成本可承受(economically)的条件下,通过非常快速(velocity)的采集、发现和分析,从大量化(volumes)、多类别(variety)的数据中提取价值(value),将是IT 领域新一代的技术与架构
;分析技术:
数据处理:自然语言处理技术
统计和分析:A/B test; top N排行榜;地域占比;文本情感分析
数据挖掘:关联规则分析;分类;聚类
模型预测:预测模型;机器学习;建模仿真
大数据技术:
数据采集:ETL工具
数据存取:关系数据库;NoSQL;SQL等
基础架构支持:云存储;分布式文件系统等
原创力文档

文档评论(0)