- 2
- 0
- 约1.08万字
- 约 11页
- 2016-12-22 发布于湖南
- 举报
驾驭大数据
庞大的信息流现在有了新的约束规则。PB 级数据世界内发生了哪些变化?大数据将如何改变您的做事方式?
海量的信息充斥着 IT 世界。这些信息从全球 43 亿部电话和 20 亿位互联网用户生成的数据中流出,与 300 亿个 RFID 标记和数百颗人造卫星和每秒都在不断发送的更多信号融合在一起。当然,没有人会一下子处理全球所有数据。但是当这个数据馅饼变大时,每个人分得的部分也会变大。当您开始以 ZB 为单位衡量这个馅饼时,甚至一小部分也会变得很大。这里有一个具体的统计信息:单单 Twitter 每天就会增加 12 TB 的数据 - 全文本,而且每次最多添加 140 个字符。
这种规模的数据处理是一种新的极限,许多人正在以多种不同的方式接近它。但人们越来越意识到,我们将数据的诞生视为永远不会消失的挑战。一些人将此称为大数据。
大数据:3 个 V
当我们听到词语 “大数据” 时,大部分人立即会想到庞大的数据集,当数据量达到 TB 和 PB 级时,它们就需要以不同的方式对待。能够良好地处理较小数据量的算法常常无法足够迅速或有效地处理较大的数据集,没有无限容量这样的东西,无论存储介质和管理如何发展。
但是,数据量(volume)只是大数据挑战的一个方面,其他两个方面指的是速度(velocity)和多样性(variety)。速度表示收集、处理和使用数据的速度需求。许多分析算法可处理
原创力文档

文档评论(0)