网站大量收购闲置独家精品文档,联系QQ:2885784924

业务平台集中监控平台介绍〔电信〕200811.ppt

业务平台集中监控平台介绍〔电信〕200811.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
业务平台集中监控平台介绍〔电信〕200811

业务平台集中监控系统 介绍 天讯瑞达通信技术有限公司 徐高平 2008年10月 公司简介 公司定位 运营支撑系统(OSS)领域规范 中国电信本地网集中告警需求规范-2004年、2005年 大客户业务质量实时监视系统规范-2005年 CTG-MTAI 多业务告警适配层规范-2006年 陕西电信本地网集中告警规范-2007年 中国电信OSS研究2.0-2007年 中国电信业务平台集中监控系统规范-2008年 中国电信CTG-MBOSS服务开通、施工调度部分、综合网络激活部分规范-2008年 系统介绍目录 运营支撑系统(OSS)的发展趋势 业务平台分类 业务平台维护手段现状 现状问题分析 场景展现 维护人员小李工作的一天 8:00 提早上班,先检查昨天出过故障的A系统是否工作正常 8:30 接到电话,B系统无法登录 9:00 确认B系统的根目录空间满,导致系统运行不正常,删除日志文件并重启进程后恢复 9:50 发现C系统和A系统无法互连,无法确定故障位置,打电话让C系统原厂商进行支撑 10:30 C系统的厂商确认自身系统没问题,但A系统的厂商认为自身系统也无问题,各自重启接口进程后恢复。 13:00 C系统和A系统的互连故障再次出现,再让两个原厂商进行调试 14:00 发现故障原因是A系统的接口机负载过重,导致进程锁死 15:30 进一步发现负载过重的原因是C系统对A系统的访问方式有BUG,访问结束后未能释放资源 …… 结论 小李郁闷的一天 疲于奔命 头痛医头、脚痛医脚,无法确定故障的实际位置 无法掌握业务系统的整体情况 缺乏系统优化的依据 目录 数据模型框架 数据模型框架-针对C网业务的扩展 核心概念模型 目录 告警自动处理规则 性能采集配置__任务 性能采集配置__门限 性能分析 健康度评估 关注业务应用的状态 基于历史数据建立业务状态模型 健康度评估基于当前状态与业务状态模型的比较 对业务状态模型进行修正 真正反映业务平台的整体健康状态 资源配置管理 子对象自动发现 巡检任务配置 巡检结果统计 目录 系统目标 场景再现 小李愉快的一天 8:30 准时上班 8:40 查看业务平台的整体状态,发现B系统根目录空间预警,清理日志文件后,故障清除 9:30 发现A系统接口机负载持续上升,电话要求原厂商进行检查 9:50 A系统厂商发现是因为C系统访问接口的方式存在BUG,造成故障 10:00 将C系统的接口进程暂停,并要求原厂商对其进行处理。 12:00 中饭前开启系统整体巡检并生成报告 13:00 设定故障短信通知规则,去参加会议 …… 结论 小李愉快的一天 从容不迫 迅速掌握故障位置和影响范围 实现对业务系统整体的监视和管理 量化的系统优化决策支持 优势总结 问题与讨论 天讯瑞达与运营商一起成长 * * * * * 应用功能介绍 故障管理 性能管理 资源管理 作业计划 性能实时监视 性能实时监视 获取关键点 的状态信息 与日常平均值、 历史峰值和设计容量值 进行比较 评估业务平台 的健康度 应用功能介绍 故障管理 性能管理 资源管理 作业计划 应用功能介绍 故障管理 性能管理 资源管理 作业计划 作业计划定期巡检 巡检内容不仅仅限于基础硬件、基础软件层的数据采集 巡检关注业务功能点 通过一系列巡检结果,给出业务、业务功能的状态分析 提供巡检结果的分析报表 提供巡检的预警管理 实现主动发现故障的目标 设定作业计划 制定对关键点 进行巡检 自动对关键点 进行状态、 性能数据采集 对巡检结果 进行分析 主动发现故障 定期巡检效果 人工巡检: 1、每天需要人工抽检数百台机器,成本高,工作量大,不能全部机器进行巡检,难以实际完成作业计划 2、每天需要登录服务器人工统计业务指标 定期巡检: 1、系统可实时或准实时地对所有的机器进行监控,成本低,准确性高,可巡检所有机器。 2、系统每天自动统计相关的业务指标,并对业务指标模型进行修正 局部范围: 1、主要针对基础硬件、基础软件的状态进行简单查询 2、对业务应用功能停留在单点测试的水平上 3、无法掌握业务平台的完整状态 整体范围: 1、关注应用软件、业务功能的状态巡检 2、提供对业务流程的完整拨测功能 3、从局部到整体对业务平台的状态进行监控 故障人工响应: 1、故障预警手段薄弱,通常巡检或者出现故障时才发现,且存在遗漏的可能 2、需要人工进行故障处理,处理较为缓慢。 故障自动分析: 1、系统提供性能趋势分析等手段,在不错过任何故障的同时,还能够发现潜在故障 2、系统提供自动化的故障恢复手段,提供故障处理时间。 技术架构 技术架构 系统需求 规范定位 软件产品 业务平台集中监控系统 系统需求 核心设计 应用功能 技术服务 软件技术架构 采集管理 适配平台 数据处理 请求处理 展示与交互平台 配置管

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档