Cloudwiz智能运维产品介(技术)精编.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Cloudwiz智能运维产品介(技术)精编.ppt

这里的话,我建议删除,文字太多,不够概括 前面已经分析过现状,这里依旧在提现状有点赘述,建议只提挑战 另外,现状从目前的困难着手,引起客户共鸣 挑战从产品能够带来的解决方案入手,可以更好地引出我们的产品 所以我提炼出这三方面的优势 统一监控 – 指标监控(多种服务,多种指标) 统一监控 – 日志监控(全文搜索) 智能报警 – 全面,灵活 智能分析 – 故障溯源(学习故障历史反馈,直接溯源根因) 智能分析 – 关联分析(关联指标,事件,日志) 智能分析 – 日志分析(日志聚类,日志对比) 智能分析 – 运维知识库(专业知识传承共享) 05 Cloudwiz 案例 电网大数据平台的各种服务及系统 案例:国家电网大数据平台 HBase Hive Hadoop Tomcat Zookeeper Storm Spark MySQL CentOS Kafka Flume 案例:国家电网大数据平台 客户HBase每过3-4天全面死机,只能重启,严重影响业务 挖掘日志,发现死机前HBase节点出现长时间停顿,被zookeeper服务器误诊为此节点死亡 匹配知识库,找出原因为HBase节点进行内存Swap,而更深层次的原因为服务器时钟漂移 提出解决方案供客户选择 客户采纳建议进行实施,彻底排除故障 目标一:为国家电网的智能电网战略提供不间断的、稳定的大数据计算平台 问题和挑战:主要存储服务HBase 每隔几天会出现宕机,因为宕机经常发生在半夜,运维人员不能及时得到报警,造成大数据平台长达数小时的停运,直接影响平台上运行的分析工作。因为不能排查问题根源,此问题不断发生。 解决:指标、日志整合分析查找故障根源,知识库推荐解决方案。问题完全解决。配置报警规则,及时发现问题。 服务器上CPU使用率被自动探测出有异常升高,如红点所示,cpu.usr在22:00 - 00:00和9:00左右25%,而平时一般在8%。需要找出原因。 案例:国家电网大数据平台 目标二:在运维国家电网大数据计算平台过程中,及时发现、查找并解决可能造成重大问题的误操作、误配置等运维问题。 问题和挑战:如何及时发现问题并在短时间内发现根源,对任何运维团队都是一个极大的挑战。 解决:指标的智能关联分析能够辅助运维人员快速查找故障根源 Cloudwiz 系统自动查找和匹配出相关联的指标,提供故障根源推断 案例:国家电网大数据平台 目标二:运维国家电网大数据计算平台过程中及时发现、查找并解决可能造成重大问题的误操作、误配置等运维问题。 问题和挑战:如何及时发现问题并在短时间内发现根源,对任何运维团队都是一个极大的挑战。 。 解决:指标的智能关联分析能够辅助运维人员快速查找故障根源 选择hbase.regionserver.server.writeRequestCount对比cpu.usr。两条曲线非常吻合。说明cpu的升高是由于hbase的write数量增加引起的。客户马上意识到最近一个修改导致写操作会增加。经过修改以后,cpu正常下来。 案例:国家电网大数据平台 目标二:运维国家电网大数据计算平台过程中及时发现、查找并解决可能造成重大问题的误操作、误配置等运维问题。 问题和挑战:如何及时发现问题并在短时间内发现根源,对任何运维团队都是一个极大的挑战。 解决:指标的智能关联分析能够辅助运维人员快速查找故障根源。 上图是可用磁盘空间的实时数据。下图是统计的趋势线。根据趋势,目前可用磁盘空间49GB在62天后用完。用户可以及时安排应急方案和设备采购计划 案例:国家电网大数据平台 目标三:有效地进行国家电网大数据计算平台的日常运维工作,优化架构,及时升级到最新且稳定的版本以排出已知的问题。 问题和挑战:对运维团队的技术要求很高,一般团队较难在短时间内达到,致使运维面临瓶颈 解决:Cloudwiz 的专家团队能够与客户的专业团队协同工作,帮助客户的技术团队迅速成长,或者完全接手客户的运维工作。专家报告提供专门针对客户系统的贴身诊断和优化技术报告。 案例:国家电网大数据平台 大数据系统不同服务最佳版本和版本间依赖性推荐、演进方案 目标三:有效地进行国家电网大数据计算平台的日常运维工作,优化架构,及时升级到最新且稳定的版本以排出已知的问题。 问题和挑战:对运维团队的技术要求很高,一般团队较难在短时间内达到,致使运维面临瓶颈 解决:Cloudwiz 的专家团队能够与客户的专业团队协同工作,帮助客户的技术团队迅速成长,或者完全接手客户的运维工作。专家报告提供专门针对客户系统的贴身诊断和优化技术报告。 案例:国家电网大数据平台 专家报告优化系统、配置、架构,提升性能 目标三:有效地进行国家电网大数据计算平台的日常运维工作,优化架构,及时升级到最新且稳定的版本以排出已知的问题。 问题和挑

您可能关注的文档

文档评论(0)

2837587390 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档