网站大量收购独家精品文档,联系QQ:2885784924

企业数据分层管理及对接大数据平台.pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业数据分层管理及对接开源大数据技术 徐正君 zheng-jun.xu@ © 2016 SAP SE or an SAP affiliate company. All rights reserved. 1 大数据技术架构需要面对的挑战 传统的数据库部署方式不擅长处理TB级别的数据,快速增长的数据量超越了传统数据库的管理能 力。如何构建分布式的数据仓库,并可以方便扩展大量的服务器成为很多传统企业的挑战。 很多企业采用传统的数据库技术,在设计的开始就没有考虑数据类别的多样性,尤其是对结构化 数据、半结构化和非结构化数据的兼容。 传统企业的数据库,对数据处理时间要求不高,这些数据的统计结果往往滞后一天或两天才能统 计出来。但大数据需要实时处理数据,进行分钟级甚至是秒级计算。 © 2016 SAP SE or an SAP affiliate company. All rights reserved. 2 为什么要分层处理? © 2016 SAP SE or an SAP affiliate company. All rights reserved. 3 为什么要分层处理? © 2016 SAP SE or an SAP affiliate company. All rights reserved. 4 SAP 大数据分层处理逻辑架构 SAP HANA Smart Data Streaming 运  采用高吞吐量和低时延流处理技术实时捕获数据  自定义规则来转换、过滤、聚合事件流 算 速 SAP HANA SAP HANA  在内存中即时处理数据 Hot Data 度  组合结构化和非结构化数据 Instant Results  创新的行业解决方案和企业应用程序  基于预测、文本和空间数据的高级分析 Dynamic Tiering SAP HANA Dynamic Tiering Warm Data  准实时的处理和分析能力 量 Petabyte storage  高性能企业级数据仓库 据  近线列式动态存储 数 Hadoop  基于廉价设备的高效数据处理系统 HADOOP  海量非结构化数据的联邦查询 (通过MapReduce 同步 ) Cold Data  通过 Hadoop 分布式文件系系统(HDFS)实现无限量存储 © 2016 SAP SE or an SAP affiliate company. All rights reserved.

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档