網管系统设计文档.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
網管系统设计文档

网管系统设计文档 文档作者: 贺云鹏 编写时间:___________________ 文档审核:___________________ 修改历史记录 编号 日期 版本 修改页码及条款 作者 1 2011-4-5 1.0 初稿 贺云鹏 一.设计目的 网管系统是指监控,组织和控制网络中的各种设备的活动状态。其目标是确保网络中的所有设备工作正常,发生报警时可及时响应并在出现异常时能及时响应和排除故障。 二.基本功能 设备管理:对前端设备,路由器,业务服务器等进行统一管理. 配置管理:对设备和系统进行各类网络参数的定义和设置。 报警管理:对前段设备报警或业务报警进行及时响应与联动,并通知用户处理。 故障管理:查找并解决因硬件和软件问题而引起的网络故障。 性能管理:使用特定的代理完成对软件和设备进行效率检测,并将监测数据进行统计分析作为改进与维护依据。 三.基本要素 1.SNMP(简单网络管理协议):专用的通信协议,版本包括V1,V2,V3,其中V2应用最为广泛。通过GET,SET或TRAP操作设备信息库实现设备基本信息的查询与管理。 SNMPV1 SNMPV2 SNMPV3 支持的PDU Getrequest Getnextrequest Getresponse Setrequest Trap 增加response Getbulkrequest Informrequest 同V2 安全性 明文传送,安全性低 明文传送,安全性低 基于用户的安全模型,基于视图的访问控制模型,安全性很高 复杂性 简单使用广泛 简单使用广泛 开销大,比较繁琐 2.管理信息库(MIB):一个按层次结构组织的树状结构,由管理对象按照模块的形式组织而成。各厂商产品的MIB依据标准化的Internet管理信息结构,所以可以保证第三方网管软件读取和管理设备信息. 3.代理软件(Agent):运行在网络设备终端上软件模块,直接操作该设备本地的管理信息库(MIB)或者与系统运行的软件进行交互完成本地设备信息或状态的收集并提交网管服务器统一处理。 4.报警采集服务器:通过SDK与前段设备进行交互及时反馈前段设备的报警信息,同时增加接收设备主动上报与主动设备状态轮询功能。 5.网管服务器:通过主动监测或被动接收来自报警采集服务器或代理软件提交的信息,管理网络中的所有设备状态与报警信息,并通过级联的模式实现报警或查询命令的上传或分发。 6.WEB客户端:与网管服务器进行交互完成对网络信息的查询与处理。 三.网络布局 四.详细设计 Agent代理 该进程单独运行在特定的主机上并负责收集主机的运行信息,主要包括主机流量,CPU使用状态,特定进程状态,磁盘运行状态等,同时可以检测特定数据异常闸值报警,如:上载流程过低。 Agent采用与其他模块相同的TCP+XML的方式与其他服务程序进行通讯,包括接收来自管理服务器的控制应答;定时向网管服务器发送采集的信息;异常数据闸值报警;与本地服务交互等。 主要流程如上图 1.配置文件:Agent代理配置信息默认保存在本地ini配置文件中,成功登录网管服务器后需要请求更新本地服务配置信息。 2.信息采集:根据配置信息Agent代理需要与监控资源进行TCP+XML信令通讯,并负责定时收集资源运行状态。采集的数据需要根据需要进行本地缓存并集中提交网管服务器。 3.数据闸值报警:根据配置信息Agent 将异常的数据流程通知报警采集服务器,如:上传数据过低等。 4.设备巡检:主要针对存储等报警采集服务器无法检测的信息。 报警采集服务器 报警采集服务器主要负责服务器,网络设备,前端设备等硬件设备的报警数据的采集与初步处理,并将报警信息通知网管服务器进行统一写入与处理。 主要流程如上图 设备列表:报警采集服务器需要请求网管服务器获取到绑定的设备列表,并根据配置SDK或SNMP协议进行通讯,同时接收相应的报警设备更新。 集群处理模式:一个系统中可能存在多台报警采集服务器,使用条带划分的模式建立设备与服务器之间的关联并由网管服务器统一管理分配。 报警采集:根据配置报警服务器需要通过SDK,SNMP协议等,主动巡检+被动接收的方式检测。例如:设备网络连接断开需要通过主动PING进行检测;SDK设备的探头报警需要被动接受SDK回调等。 报警信令封装:采集到的报警信息,需要讲过报警采集服务器的封装成统一信令格式并通知网管服务器进行统一处理。对于底层不同的数据需要 闸值报警:报警采集服务器需要处理来自Agent代理的闸值报警。 设备巡检:网管服务器将设备进行巡检命令提交至对应的报警采集服务器,由对应服务器完成巡检内容,并返回结果。 网管服务器

文档评论(0)

sd47f8cI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档