大数据技术交流37.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据技术交流37大数据技术交流37

大数据平台技术交流 吴敏达 – 资深技术顾问 2 从各种各样类型的巨大数据中,快速获得有价值信息的能力,就是大数据技术 什么是大数据 Variety: 管理复杂的多角度关系和非关系类型的数据 (你是否忽略利用的非结构化数据进行决策吗) Velocity: 流数据或者大量数据的移动 (你是否希望通过实时操作提供更好的结果) Volume: 数据量从TB级到ZB级 (你是否收集了所有数据,并在使用它吗) Veracity: 1/3 的领导在做业务决策时候不相信获得的信息 大数据参考架构 超越传统的数据仓库概念 流计算 Internet 级别 传统 数据仓库 In-Motion Analytics Data Analytics, Data Operations Model Building Results Internet Scale Database Warehouse At-Rest Data Analytics Results Ultra Low Latency Results InfoSphere BigInsights 传统/关系型 数据源 非传统/非关系型 数据源 传统/关系型 数据源 非传统/非关系型 数据源 Cloud | Mobile | Security IBM大数据平台和应用框架 通过可视化的方法 采集、抽取、以及探查数据 应用加速器,加速应用开发,快速实现分析价值 BI / Reporting BI / Reporting Exploration / Visualization Functional App Industry App Predictive Analytics Content Analytics Analytic Applications(分析应用) IBM Big Data Platform(大数据平台) Systems Management Applications Development Visualization Discovery 分析流数据,以及在大数据的是谁数据洞察 数据管控 (数据质量、生命周期、……) 低成本地分析PB级结构化和非结构化数据 操作型数据或者历史数据的,基于数据仓库内嵌分析 索引和联邦的上下文相关分析 议程 IBM hadoop平台-BigInsights IBM 流计算-Streams IBM数据仓库平台-pure Data 基于大数据平台的数据分析-DataExplorer IBM大数据优势汇总 6 Forrester Wave关于大数据的报告 BigInsights 企业版 连接和集成 基础架构 可选 IBM 产品 分析和探查 应用 . . . 管理和开发工具 管理控制台 Monitor cluster health, jobs, etc. Add / remove nodes Start / stop services Inspect job status Inspect workflow status Deploy applications Launch apps / jobs Work with distrib file system Work with spreadsheet interface Support REST-based API . . . Eclipse 开发工具 Text analytics MapReduce programming Jaql, Hive, Pig development BigSheets plug-in development Oozie workflow generation IBM GPFS –FPO BigInsights 优势列表 High Performance Availability GPFS-FPO At least 2X faster than open source Hadoop 17x throughput speedup for document index lookups Fault resistance for Real Time Data POSIX Adaptive MapReduce SQL Interface ( BigSQL ) Integrated Install Mgt Consoles Security LDAP+ High speed LZO Compression Development Tooling environment, testing, and optimization Warehouse RDBMS Streams Integration SystemT –

文档评论(0)

ganqludp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档