网站大量收购独家精品文档,联系QQ:2885784924

企业大数据平台建设方案.pptxVIP

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
建立在PAAS平台上的新一代数据平台解决方案智慧企业大数据平台建设方案企业大数据平台建设方案全文共52页,当前为第1页。 Agenda企业新一代数据平台的技术需求创新的技术平台建设思路企业大数据平台建设方案全文共52页,当前为第2页。 面向大数据的分析Now What?So What?What?大数据分析企业内、外部的结构化和非结构化数据数据量在TB级以上以数据挖掘、预测和实时分析为主,强调对业务驱动传统BI 分析企业内部的结构化数据,数据量在GB~TB级以报表、查询和分析为主,反应当前业务现状企业大数据平台建设方案全文共52页,当前为第3页。 更丰富、更细致的客户管理大数据分析在企业的应用更准确、更及时的营销管理更高效、更全面的风险管理Customer 360o Single ViewKey Life Events Next Best ActionStress Test Credit Assessments企业大数据平台建设方案全文共52页,当前为第4页。 通用银行业大数据分析平台管理分析类应用数据交换平台应用集市数据区核心系统总账系统国结系统网银系统……系统企业内外部半结构化、非结构化数据数据产生层数据交换层数据传输数据稽核数据处理流程调度监控告警……数据服务层非结构化数据区沙盘演练数据区用户评价信息移动互联信息……元数据数据应用层历史归档数据区 HDS客户主题协议主题产品主题事件沙盘演练应用实时分析应用数据管控层POS增量财务增量库存增量采购增量……增量临时数据区实时数据区核心数据总账数据国结数据……数据主题数据区社交媒体信息网银数据… …客户管理财务管理风险管理……管理客户管理财务管理风险管理……管理运营管理用户访问层决策人员管理人员数据科学家业务人员客户汇总账户汇总机构汇总产品汇总… …企业大数据平台建设方案全文共52页,当前为第5页。 企业大数据平台数据内容及实现技术Page 7应用平台提交请求访问的数据,包括结构化和非结构化两类在线存储周期超过数据生命周期规划的数据适合Hadoop分布式架构管理无法用二维表结构来逻辑表达的无结构性的数据。例如文本、音频数据等。方便用数据库的二维表结构来逻辑表达实现的数据,数据结构字段含义确定,清晰。例如:客户信息、用电记录等。是挖掘数据价值的主要对象。支持分析型应用,时效性较低支持前台交易系统查询需求,具有可靠性高、并发度大、采集频率短的特点按数据格式类别划分按数据格式类别划分按数据采集频度划分大数据 平台在线数据归档数据非结构化数据结构化数据准实时数据非实时数据面向贴源数据查询和主题数据整合。数据区,适合X86MPP数据库集群范式化模型数据面向分析类应用。对应ADW和CM数据区,适合MPP数据库集群维度模型数据按数据模型划分企业大数据平台建设方案全文共52页,当前为第6页。 Page 8企业大数据平台架构原则平台8技术-跨平台数据交换批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-平台内数据复制跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载,数据的形式不发生变化,不涉及数据转换。数据复制后产生的数据副本主要是为了便于数据引用,需要制定数据副本的生命周期管理策略以及保证数据副本的只读属性。数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过全行指标口径和维度、度量信息,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。企业大数据平台建设方案全文共52页,当前为第7页。 Page 9企业大数据平台架构原则平9数据-历史数据分级存储和访问近线数据存储形式保持源表源结构,主要以数据库形式存储,支持在线数据查询、访问和应用支持,响应时间秒级。归档数据以廉价大容量磁盘方式存储,存储形式会根据数据环境和未来应用的差异,采用不同于源结构的存储形式。同时,归档数据需要创建“被动索引”并具备恢复到主题数据区或者汇总数据区的能力。数据-非结构化数据管理对于交易和处理过程中形态尚不稳定的非结构化数据,可由各平台根据时效性、一致性控制和完整性控制等要求考虑自行处理安全-数据访问安全对于普通的查询访问应用,应该具备屏蔽敏感信息的展现的能力。面向行内用户的数据访问,应按照数据的属主进行访问隔离。运维-系统日常运行性能管理在数据量不断增加、访问用户数量的增长、用户数据使用成熟度的变化、数据ETL持续滚动开发等场景的不断变化下,需要围绕日常性能管理,不断调整系统设计和运行策略。企业大数据平台建设方案全文共52页,当前为第8页。 建设新一代数据平台的驱动力完整的大规模数据的快速捕获流

文档评论(0)

孙二娘 + 关注
实名认证
文档贡献者

专注文档领域

1亿VIP精品文档

相关文档