中国铁路总公司TDCS运维监控系统项目-成果汇报.ppt

中国铁路总公司TDCS运维监控系统项目-成果汇报.ppt

项目实施效果 监控故障案例2 目前监控到的告警举例: Avmon监控到ip为172.16.11.14的AIX服务器报警,并上传到告警平台。 经过与工程师确认是文件系统使用率过高时报出来的。 项目实施效果 监控故障案例3 目前监控到的告警举例: NNMi监控到10月24日多个网络设备内存值偏高,设备报出性能告警。 经过与网络工程师陈京确认是当时升级设备系统IOS使设备短时间负荷较高产生的告警。 提纲 项目实施的效益 对未来的展望 在完成对设备监控的基础上,兼顾系统应用的监控,包括数据库,中间件,应用进程的监控 通过3D机房,完善业务监控手段,实现系统可视化监控 通过监控系统的建设,提升业务系统服务的可用性、持续性 在做好监控的基础上,梳理运维管理流程,使运维工作更加顺畅 对未来的展望 工作计划 贯彻落实状态修、实现高效运维 2014年 2015年 2016年 QA! Thanks! 将事件信息分成三种对象,即原始事件、标准事件、告警(当前告警和历史告警) 针对不同对象的不同属性和特点提供不同的处理方法,保证告警的及时性和准确性, 同时,根据用户环境的实际情况,通过不断配置、调整和细化事件标准化规则、事件压制规则、事件过滤规则、相关性分析规则,告警升级规则、告警传递规则、告警通知规则、工单接口规则, 为用户提供清晰的告警分类、明确的告警标题、人性化的告警内容、灵活的告警通知,多种维度的告警信息统计。 * 将事件信息分成三种对象,即原始事件、标准事件、告警(当前告警和历史告警) 针对不同对象的不同属性和特点提供不同的处理方法,保证告警的及时性和准确性, 同时,根据用户环境的实际情况,通过不断配置、调整和细化事件标准化规则、事件压制规则、事件过滤规则、相关性分析规则,告警升级规则、告警传递规则、告警通知规则、工单接口规则, 为用户提供清晰的告警分类、明确的告警标题、人性化的告警内容、灵活的告警通知,多种维度的告警信息统计。 * ? 2006 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice ? 2006 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice 铁总TDCS运维监控系统项目 阶段成果汇报 提纲 项目背景及目标 目前TDCS系统部中心节点数据中心承载着对全国铁路行车进行实时、集中、透明指挥的重要任务,系统的重要程度不言而喻。为了确保IT环境正常运行,必须保证系统所涉及的每个环节都正常工作。这就要求能对环境中的关键设备进行实时管理,及时发现问题、解决问题,向管理员发出警告信息。这些系统管理工作单靠系统维护人员的手工操作是远远不够的,需要一整套全面的系统管理软件帮助系统管理人员监视和维护IT系统。 2014年9月1日 项目启动 2014年10月31日 完成框架搭建,部分设备接入 2014年11月31日 完成主体功能调测 2015年3月15日 完成设备接入 2015年3月31日 完成试运行、培训、汇报等工作 项目实施计划 项目成果汇报 项目当前实施情况 本次项目监控TDCS系统部中心节点数据中心小型机16台,PC Server 69台,网络设备40台,存储2台,以及工作站4台、数据库2套、中间件Tomcat1套、MQ2套。 类型 已监控设备数量:台 设备总数量:台 完成比例:% 备注 小型机 10 16 62.5 ? 刀片机 40 69 58 ? PC 服务器 0 3 0 PC终端 1 4 25 完成测试 存储 0 2 0 正在打通网络环境 网络设备 27 40 67.5 余下13台不具备接入条件 ORACLE 0 2 0 ? Tomcat 1 1 100 完成部署,正在调测 MQ 0 2 0 完成开发,正在部署 合计 79 139 57 ? 项目成果汇报 主要监控指标-主机系统 类别名称 指标大类 指标小类 名称 主机配置信息 配置 系统配置指标 主机名 配置 硬件配置指标 主机厂商 配置 硬件配置指标 主机CPU个数 配置 硬件配置指标 主机CPU型号 配置 硬件配置指标 主机CPU主频 配置 硬件配置指标 主机内存总大小 配置 系统配置指标 主机操作系统版本 配置 系统配置指标 主机操作系统kern

文档评论(0)

1亿VIP精品文档

相关文档