大数据的,商业智能的挑战.pptVIP

  • 3
  • 0
  • 约1.43万字
  • 约 32页
  • 2017-06-22 发布于山西
  • 举报
大数据的,商业智能的挑战

搬运大数据的亨利 2013.4.20 大数据背景 更多的数据? 谷歌自始至终都认为数据是越多越好,用谷歌产品研发总监Peter Norvig的话就是:更多的数据胜过更好的算法 开源大数据生态圈 诞生:谷歌 大数据领袖谷歌,于2003年起发布一系列论文: 1. 《The Google File System 》 2. 《MapReduce: Simplified Data Processing on Large Clusters》 3. 《Bigtable: A Distributed Storage System for Structured Data》 战火被点燃,从此进入大数据时代 开源大数据生态圈 诞生:开源大数据生态圈 1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成 2. Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户 开源大数据生态圈 Hadoop MapReduce不适合实时计算? 1. 任务分配Server不会将信息Push到计算Node,而是让计算Node通过心跳去Pull任务 2. 基于框架的通用性,MapReduce代码也会在HDFS中传送,在各计算Node展开,再通过启动新JVM进程装载并运行 3. 类似的J

文档评论(0)

1亿VIP精品文档

相关文档