大数据扫盲.docxVIP

  • 4
  • 0
  • 约5.12千字
  • 约 8页
  • 2017-01-08 发布于重庆
  • 举报
大数据扫盲

“大数据”并不神秘“大数据”一词译自英语”Big Data”,在最近一段时间可以说是甚嚣尘上,成为IT界炙手可热的新名词,并为全球各大IT厂商和研究机构所推崇。但究竟什么是“大数据”,各家却又莫衷一是,暧昧不清。有人强调海量的数据规模,认为数据量达到PB级以上就是大数据;有人强调数据类型的多样化,认为大数据指的是互联网以及多媒体应用的出现使得诸如日志、点击流、图片、声音和视频等非结构化数据的比重越来越大;也有人认为大数据是因为移动设备、RFID、无线传感器等造成的数据量飞速增长。IBM公司则是将各种说法进行了集成,将“大数据”的特征概括成了三个V,即大量化(Volume)、多样化(Variety)和快速化(Velocity)。可以看到“大数据”的定义还是相对松散和宽泛,各家众说纷纭,各有侧重。而且就算是对于同一个特征,比如数据规模,在不同的行业、不同的企业里,其标准也是不一样的,例如对于中小的企业,可能TB级的数据规模就已经算是大数据了,而对于一些大型企业来说,PB级的数据处理已经司空见惯。至于数据类型、数据时效性等其他特征,各个企业的关注点和需求也不尽相同。尽管“大数据”没有统一的定义和标准,但通过对各家之言的归纳和抽象,我们仍然可以发现“大数据”的本质其实并不神秘。简单来说,所谓的“大数据”就是“无法在特定时间内用常规方式方法对其内容进行获取、管理和分析的数据集合”。从这点来看

文档评论(0)

1亿VIP精品文档

相关文档