- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
如何建设稳定可靠运营系统
如何建设稳定可靠运营系统
摘 要:文章从公司实际情况出发,以现有运营系统及运营保障机制为例,介绍了如何进行稳定可靠运营系统的日常运行保障,同时通过对运营维护中关键技术的描述,阐述了在未来一段时间内运营维护工作的发展方向。
关键词:运营系统;运维;稳定;可靠
引言
随着公司业务的发展壮大,企业的日常运营维护工作已经越来越被重视,运营系统的可靠稳定关系着客户使用满意的高低。因此,打造一个稳定、可靠的运营系统是所有运营企业的核心工作,由此孕育而生的关键技术也越来越多,也更好的为运营系统的维护提供了技术保障。
1 定义
运营维护简称运维,一般是指对企业已经建立好的网络系统软硬件的维护以及对信息系统的维护。例如,电脑硬件、软件维修,电话问题处理等基础维护工作。同时也包含了对外的运营系统的维护,要保证运营系统是在正常运作的,通过各种手段,有人工的也有自动的,进行监控,出现问题及时处理解决等等。
2 运营维护
运营系统的稳定可靠是运营维护的重点工作,要对公司内部、外部使用的所有自运营系统的正常运作进行保证,保证服务器能够正常运行,保证系统资源足够使用,在必要时进行硬件升级,保证出问题时能够第一时间分析解决问题,主要可以从以下几个方面采取保证措施。
2.1 巡检保障
运营系统由两大部分组成,一部分是运行环境,包括网络、硬件等资源,一部分是系统程序,包括各种应用程序以及网站等。要保证系统的稳定,就必须保证运行环境和系统程序是稳定正常的,为此可以通过日常巡检来进行检查保证。
每天至少对运行环境进行两次巡检,包括应用程序开启、系统资源、系统事件日志、系统监控情况等等,确保运行环境是正常的。
只有环境的正常也是不够的,还必须保证程序开启后能够正常提供工作,因此需要安排人员通过一些自动化程序验证以及人工的巡检验证来保证应用程序能正常提供业务功能。
2.2 监控保障
为了保证系统的稳定可靠,如果仅仅是通过人为的巡检保障是不够的,还需要配置完备的运营监控机制,进行主动监控以及主动报警。
一般的监控系统能做到的是进行邮件和短信报警,但是如果在夜间出现问题,就很容易被忽略,因此需要一套能提供电话报警的监控系统,同时对于运营系统的各种参数需要定期进行分析,也需要一套对各种运营参数能提供详细报表的监控系统。
监控系统一:
一套自主开发的监控系统,主要是对系统资源的使用情况以及应用程序启用情况进行监控。
运营系统每台服务器安装客户端,同时安装一台服务器端,客户端将报警信息提交到服务器端,服务器端连接到报警终端,报警终端连接公司语音网关系统和短信平台,一旦报警终端收到报警信息,将向系统负责人员发送一条报警信息,告知某某系统出现问题,同时向报警手机拨打报警电话,语音提示系统负责人查看报警信息。双管齐下进行报警提醒,避免只有短信晚间容易让负责人遗漏报警信息的问题。
监控系统二:
一套比较成熟的监控软件,对系统、网络、资源以及整体的可用性进行比较全面的监控,并产生详细的日志,这套系统主要是通过日志用来对系统的可用性进行分析,并为系统是否需要进行优化升级等操作提供可靠的参考依据。
通过这两套监控系统配合人为的日常巡检,对运营系统的正常稳定运行提供了有效的保障。
2.3 可靠性、可用性保障
系统稳定可靠的运行,要考虑到各种可能出现的意外情况,例如服务器出现故障、网络中断或是机房无法正常工作等等,针对这些情况,必须要采取相应的措施来保证运营系统的可靠性和可用性。
目前通常都是采取如下措施:
1)数据库本地做镜像,在主服务器出现故障时立即切换。
2)程序本地做负载均衡,避免出现单点故障。
3)数据库异地做日志传送,在机房或网络出问题时,切换到异地服务器。
4)程序异地做备份,在机房或网络出问题时,异地启用。
3 运营系统要求
运营系统的稳定可靠必须建立在一定的要求之上,只有满足这些要求,才能建设一个稳定、可靠并且高效的运营系统。
3.1 性能要求
运营系统的用户群体是企业用户,较为集中使用时间为6:30-20:00,在高度集中使用时对于性能要求较高,内存、CPU、磁盘IO都要能满足使用,支持高并发,保证使用速度较快,不会有过多的延迟。
3.2 扩展要求
随着用户量的增加,服务器、数据库性能以及容量方面都要能够通过较为简单的方式实现扩容,最好是能够在线扩容,保证服务不会中断。同时服务要能够支持负载均衡,以提高系统速度及可用性。
3.3 本地灾备
数据实现本地镜像,当服务器或是数据库无法正常工作时,能够实现本地服务的快速切换(最好是能够做到秒级切换)。
3.4 异地
文档评论(0)