毛概课程实践之大数据时代讲解.pptVIP

  • 17
  • 0
  • 约5.18千字
  • 约 35页
  • 2017-03-17 发布于湖北
  • 举报
大数据的风险 大数据属于谁? 大数据的风险 数据独裁 卓越的才华并不依赖大数据, 大数据扼杀创新。 如果对不可量化的事物进行量化, 我们将失去全面了解该事物的机会。 结束语 大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来 * * 来自《大数据时代》P008; *:可参考2008年9月4日《自然》推出的名为“大数据”的专刊。 * * 85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据 * * 第一V是Variety,海量数据有不同格式,第一种是结构化,我们常见的数据,还有半结据化网页数据,还有非结构化视频音频数据。而且这些数据化他们处理方式是比较大的。 很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显,不连贯的语法或句义 第二点就是Volume,量比较大,我们有一些用户化每秒就要进入很多数据,很多客户内部都有几批数据,还有下面淘宝都是几PB数据,所以PB化将是比较常态的情况。 非结构化数据的超大规模和增长,占总数据量的80~90%,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍 第三个是Velocity,因为数据化会存在时效性,需要快速处理,并得到结果出来。比如说,一些电商数据,今天的信息不处理没有结果化,将

文档评论(0)

1亿VIP精品文档

相关文档