商业大数据分析与可视化-全套PPT课件.pptx

商业大数据分析与可视化-全套PPT课件.pptx

第1章 商业大数据分析 1.1 大数据处理与大数据分析 数据规模的迅速增大致使各行业数据的积累量变得十分庞大,其中包含的数据类型也繁杂多样,老旧的数据管理系统和数据处理模式没有足够强大的性能可以应对这样的数据现状,由此产生了新的概念,即大数据。 1.1.1大数据处理与大数据分析 大数据的基本概念、来源与应用 大数据的基本概念 从数据库到大数据 大数据的产生和应用 大数据的基本概念 大数据是指人们利用常用的软件工具捕获、管理和处理的庞大数据集,这里的庞大是指数据处理耗时超过可接受的时长。从表面上看“大数据”这个概念是在说明数据量之多,但是已有的概念中也有表示数据量极多的名词,如“海量数据”“超大规模数据”。如何将这些概念与“大数据”相区分呢?3V定义在各种不同的大数据概念定义之中具有显著代表性,一般人们认为有规模性(Volume)、多样性(Variety)和高速性(Velocity)这三个特性的数据即大数据。1 在定义中,规模性主要代表数据集整体规模之大,是一个数据全集的概念;多样性主要形容的是数据类型多样;高速性指实时动态处理数据的速度很快,达到以秒为单位的速度即可。2 大数据的基本概念 另外,有人基于上述的3V定义补充了一个新特性,由此出现了4V定义,但是不同的研究组织对这条新特性有着不同的想法,以国际数据公司(IDC)为例,该公司认为第四特性

文档评论(0)

1亿VIP精品文档

相关文档