湖仓一体:数据湖vs数据仓库之争?.docxVIP

  • 24
  • 0
  • 约1.44万字
  • 约 32页
  • 2021-07-29 发布于内蒙古
  • 举报

湖仓一体:数据湖vs数据仓库之争?.docx

湖仓一体:数据湖VS数据仓库之争? 本文介绍数据仓库和数据湖的区别是什么,作者对其来龙去脉进行深入 剖析,来阐述两者融合演进的新方向湖仓一体。 剖析,来阐述两者融合演进的新方向 湖仓一体。 导读:随看近几年数据湖概念的兴起,业界对于数据仓库和数据湖的对 比甚至争论就一直不断。有人说数据湖是下一代大数据平台,各大云厂 商也在纷纷的提岀自己的数据湖解决方案,一些云数仓产品也增加了和 数据湖联动的特性。 但是数据仓库和数据湖的区别到底是什么,是技术路线之争?是数据管理方式之 争?二者是水火不容还是其实可以和谐共存,甚至互为补充? 本文作者来自阿里巴巴计算平台部门,深度参与阿里巴巴大数据/數据中 台领域建设,将从历史的角度对数据湖和数据仓库的来龙去脉逬行深入剖析,来阐述两 者融合演进的新方向——湖仓一体,并就基于阿里云MaxCompute/EMR DataLake的湖 仓一体方案做一介绍。 01.大数据领域发展20年的变与不变 1 .概述 大数据领域从本世纪初发展到现在,已经历20年。从宏观层面观察其中 的发展规律,可以高度概括成如下五个方面: 数据保持高速增长■从5V核心要素看,大数据领域保持高速增长。阿里 巴巴经济体,作为一个重度使用并着力发展大数据领域的公司,过去5 年数据规模保持高速增长(年化60%-80% ),增速在可见的未来继续保 持。对于新兴企业,大数据领域增长超过年20

文档评论(0)

1亿VIP精品文档

相关文档