大数据扫盲.docxVIP

下载本文档

4
0
约5.12千字
约 8页
2017-01-08 发布于重庆
举报

大数据扫盲.docx

大数据扫盲

“大数据”并不神秘“大数据”一词译自英语”Big Data”，在最近一段时间可以说是甚嚣尘上，成为IT界炙手可热的新名词，并为全球各大IT厂商和研究机构所推崇。但究竟什么是“大数据”，各家却又莫衷一是，暧昧不清。有人强调海量的数据规模，认为数据量达到PB级以上就是大数据；有人强调数据类型的多样化，认为大数据指的是互联网以及多媒体应用的出现使得诸如日志、点击流、图片、声音和视频等非结构化数据的比重越来越大；也有人认为大数据是因为移动设备、RFID、无线传感器等造成的数据量飞速增长。IBM公司则是将各种说法进行了集成，将“大数据”的特征概括成了三个V，即大量化（Volume）、多样化（Variety）和快速化（Velocity）。可以看到“大数据”的定义还是相对松散和宽泛，各家众说纷纭，各有侧重。而且就算是对于同一个特征，比如数据规模，在不同的行业、不同的企业里，其标准也是不一样的，例如对于中小的企业，可能TB级的数据规模就已经算是大数据了，而对于一些大型企业来说，PB级的数据处理已经司空见惯。至于数据类型、数据时效性等其他特征，各个企业的关注点和需求也不尽相同。尽管“大数据”没有统一的定义和标准，但通过对各家之言的归纳和抽象，我们仍然可以发现“大数据”的本质其实并不神秘。简单来说，所谓的“大数据”就是“无法在特定时间内用常规方式方法对其内容进行获取、管理和分析的数据集合”。从这点来看

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

大数据扫盲.docxVIP