大数据解决方案.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据自助式分析解决方案

议程大数据解决方案hadoop的优势实际过往案例自助式分析方案

大数据企业品牌腾飞的“肾上腺素”数据复杂度:多元性和速度TerabytesGigabytesMegabytesPetabytesBigDataWeb2.0Web2.0 ERP/CRM付款薪资货存联系人订单跟踪销售管道Web日志数字市场搜索市场网上推荐广告移动协作电子商务网页点击流Wikis/博客传感器/RFID/

设备社交网络音频/视频日志文件空间

GPS坐标数据数据集市电子政务气候文本/图像Web日志数字市场搜索市场网上推荐协作电子商务哪些是大数据

技术人才可以复用。支撑总数据量100TB,且100GB以下数据实时多维度数据的分析。开发效率比较高。开发成本比较低。产品稳定,后期维护简单。优势:01技术储备要求高高昂的硬件投资并行扩展非常困难。对海量的实时多维度分析,基本不能支持。劣势:02大数据解决方案-大型数据库(ORACLE)

大数据解决方案-分布式数据库(Mysql)logo优势:技术人才储备可以部分复用。硬件投资成本可以控制。并行扩展比较方便。劣势:需要更高端的架构师。海量数据的处理架构需要重新开发。后期技术实现,维护成本高。

大数据解决方案

-业内通用解决方案(hadoop/spark)

优势:技术人才储备多硬件投资成本可以控制并行扩展比较方便后期结合业务开发,实现稳定劣势:需要专业的方向性人才处理HDFSstormmahout朱成保企业内部系统数据互联网......ETLzookeeper集群HADOOPHDFSHBaseHiveMahoutStorm作业调度数据分析数据挖掘动态报表并行管理决策分析多维查询图表展示报表统计......

企业数据及商业智能平台的进化

-未来大数据存储OA视频、语音、图片......数据流数据仓库数据集市多维度存储数据服务分析应用其他存储服务使用CRMERP

Hadoop优势

-丰富的组件HDFS:分布式存储YARN:分布式操作系统MapReducePigHiveImpalaMahoutRHadoopGiraphHamaFlumeSqoopAvroChukwaZookeeperBigTopWhirrSearchHcatalogWebHdfsHttpFsHBaseCassandraDrillTezAccumuloStormSparkMesosPhoenixSharkHueAmbari/ClouderaManager

Hadoop优势

完善的处理流程

Hadoop优势

-洞察任意大小的数据为大数据而建新一代的性能和规模最优化的软硬件价值

客户原来是从事硬件研发,每年营业额在5000万左右,随着企业规模的扩展,领导觉得对硬件设备的故障告警不够及时。对现有的历史数据没法进行数据整合与挖掘。导致决策迟缓,故障不能够预设告警。数据已结构化数据为主背景:新平台改造:Hadoop(10)+redis(2)+mysql(4)硬件故障从原来的半小时监控,提升到现在,故障预先告警,发生故障的2分钟告警到用户,分析决策效率大大提高支撑现在数据有50+(采集点)*500+(采集源),每秒处理并发数实时数据2000条每天处理数据量实时数据200G,历史综合数据1T。现在:实际案例一智慧能源

实际案例一智慧能源

背景简介大数据存储(10)交换机数据源监控设备数据源数据流mysql(4)数据仓库多维度存储数据服务分析应用其他存储服务使用数据接入程序redis异常存储(2)

客户需要对互联网金融服务的服务企业和相关行业做到实时监控,并有效的挖掘互联网上的客户资源。数据已非结构化数据为主我公司提供相关互联网数据的爬取,并对数据初步ETL后,传入到客户。客户平台构成:Hadoop(15)+oracle(2)可以30分钟左右监控指定贷款客户的互联网舆情。可以对地区与行业进行综合评估与预测每天发送到客户数据100G,每天分析数据维度40个,综合处理1T数据。背景:现在:实际案例二互联网舆情

企业数据及商业智能平台的进化

-互联网舆情大数据存储(15)非结构化数据源(新闻,博客,BBS,微博)数据流(图像、视频)oracle数据仓库数据服务分析应用其他存储服务使用类结构化数据Hdfs,Hbase,MapReducehive

客户是一个省级运营商,需要对历史的客户话单,LBS,流量信息进行分析。数据维度非常多,需要综合考虑的数据量比较大。背景:客户平台构成:Hadoop(40)+oracle(4)+mpi(6)每天分析数据维度100个,1T数据,要求2小时完成复杂数据挖掘分析。现在:实际案例三大型国企

企业数据及商业智能平台的进化

-某国企统计分析大数据存储(40)话单数据源LBS数据源网络数据源

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档