- 1、本文档共101页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
服务方案
1.1实施主要技术措施与方法
1.1.1服务内容
本次我们将为XX客户核心设备提供下述服务内容:
硬件日常服务;
系统软件服务;
定期预防性维护及系统性能调整方案服务:
提供系统故障修复流程及应急措施;
灾难恢复服务;
备件保障服务;
备机备件保障服务;
技术保障服务;
1.1.2硬件日常服务
xxxx公司为XX客户用户提供定期预防性维护和设备出现故障后的紧急维护、操作系统软件故障的解决、免费提供系统补丁、微码的升级及其他相关技术支持等服务。
(一)主机、服务器设备维护服务
由于主机、服务器系统运行着用户的核心业务系统,因此保证主机、服务器的稳定、可靠的运行是至关重要的。
主机、服务器硬件故障排除
当用户主机、服务器设备出现硬件故障的时候(包括操作系统、HACMP软件在内),xxxx公司现场工程师要积极协调资源,负责诊断和解决,确定是硬件故障的时候,做出相应的诊断,确定故障的零部件,同时及时提供用来更换的相应配件。
进行现场分析故障
现场进行故障定位
更换故障部件
跟踪观察所更换零部件的工作状态,确保其工作稳定正常。
AIX操作系统、HACMP软件的系统重新安装、故障排除和系统恢复等日常维护服务。
如确定为硬件故障,则由xxxx公司技术工程师负责备件更换。
进行现场技术交流和反馈,以便提高客户技术人员的日常维护水平和对问题的解决能力。
提交服务报告,对客户系统运行提供合理化建议并建立相关维护档案。
主机设备健康性检查
主机、服务器设备主要的维护内容如下:
检查并输出日志
检查文件系统、卷组、逻辑卷、PV、交换空间使用状况
查看vmstat、iostat、netstat参数
备份文件系统,验证系统备份磁带
查看tmp空间使用率,检查是否系统产生core文件
检查用户登陆信息,查看系统服务的运行状况
检查系统进程,查看是否有僵尸进程
检查盘阵运行状况及日志
管理和维护文件系统,确保文件系统的完整性
监控系统各资源的使用状况(cpu,内存,文件系统等)
规划和实施对系统重要数据的日常备份和恢复
检查主机网络,确保主机网络工作正常
系统出现故障,予以配合解决
硬件设备的必要清洁
服务工程师定期检查主要设备的微码级别,并根据设备运行状况,为XX客户做微码升级。
系统运行状态分析
根据日常运行维护工作的报表对小型机、服务器系统设备进行运行状态、性能的分析、评估、调整服务,以提高系统的可靠性,获得系统运行状态的一手资料,为日后的系统性能优化和相应的业务调整提供依据。
利用操作系统的I/O监控命令监控阵列磁盘,得到相关I/O参数,进行分析,对分析结果归档保存。
使用vmstat、iostat、netstat监控命令,查询当前系统的运行状况,进行分析是否系统正常。
错误日志分析
定期整理分析系统的错误日志内容,对系统软件运行中的报错信息做出相应的分析,按照错误的级别和种类分类整理记录,对于可能引起运行故障的高级别错误做出相应的跟踪,并提出解决办法,尽量在不影响系统正常运行的情况下解决问题。
(二)存储设备维护服务
数据是企业最重要的资产,保证磁盘阵列、磁带库的稳定、可靠的运行是至关重要的。
存储设备硬件故障排除
当用户存储设备出现硬件故障的时候,xxxx公司工程师要积极协调资源,负责诊断和解决,确定是硬件故障的时候,作出相应的诊断,确定故障的零部件,同时及时提供用来更换的相应配件。
进行现场分析故障;
现场进行故障定位;
更换故障部件;
跟踪观察所更换零部件的工作状态,确保其工作稳定正常;
进行现场技术交流和反馈,以便提高客户技术人员的日常维护水平和对问题的解决能力;
提交服务报告,对客户系统运行提供合理化建议并建立相关维护档案;
存储设备健康性检查
存储设备主要的维护内容如下:
系统状态指示灯的监控,指示灯包括:
硬件检查:包括各部件和线缆的状态和功能检查;
操作面板;
电源/降温模块指示灯;
硬盘和控制器指示灯以及磁带驱动器指示灯;
通过存储管理软件,定期查看存储设备的日志,是否有错误日志;
通过存储管理软件,查看盘阵RAID信息;
通过磁带库管理软件,定期查看磁带库设备的日志,是否有错误日志;
通过磁带库管理软件查看磁带状况(如容量、回收、离线等),
查看操作系统日志,看是否有存储设备及磁带库设备的相关报错日志;
场地环境检查:包括机房环境温度和电源状况等的检测;
系统配置检查;
运行情况总结及建议;
系统运行状态分析
利用存储阵列自带的管理软件,可监控备份运行状况及磁带使用率以及性能方面的参数进行分析、预测,并对分析、预测结果归档、保存。
(三)网络设备维护服务
网络设备故障解决服务
当用户网络设备(交换机、防火墙等)出现故障的时候,xxxx公司工程师要积极协调资源,负责诊断和解决,确定是硬件故障的时候,作出相应的诊
文档评论(0)