系统运维工程师面试题及答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

系统运维工程师面试题及答案

一、基础理论与操作(侧重Linux)

问题:Linux系统中,进程状态有哪些?当发现一个进程处于D状态(不可中断睡眠)时,该怎么排查原因?

答案:进程常见状态有R(运行/就绪)、S(可中断睡眠)、D(不可中断睡眠)、Z(僵尸进程)、T(暂停)。

遇到D状态进程,先通过ps-aux|grep进程ID查看进程关联的服务(比如是否是磁盘IO相关进程),再用iostat-x1查看磁盘IO使用率(是否有磁盘读写瓶颈),用lsof-p进程ID看进程打开的文件(是否卡在磁盘读写),最后检查对应磁盘是否有硬件故障(比如smartctl-a/dev/sda看磁盘健康状态)——D状态通常是进程等待硬件资源(如磁盘IO、内存),而非程序本身问题。

问题:如何配置Linux日志轮转?以Nginx日志为例,写出关键配置项及作用。

答案:用logrotate工具配置,在/etc/logrotate.d/下新建nginx配置文件,关键配置如下:

/var/log/nginx/*.log{

daily#每天轮转1次

rotate7#保留7天的日志

compress#轮转后压缩(gzip)

delaycompress#延迟1次轮转再压缩(避免正在写的日志被压缩)

missingok#日志文件不存在时不报错

notifempty#日志为空时不轮转

create0640nginxnginx#新建日志文件的权限、属主、属组

postrotate#轮转后执行的命令(让Nginx重新生成日志)

/usr/sbin/nginx-sreload

endscript

}

配置后可手动测试:logrotate-f/etc/logrotate.d/nginx。

问题:解释Linux下“软链接”和“硬链接”的区别,实际工作中什么时候用软链接?

答案:区别:①软链接是文件指针(类似Windows快捷方式),硬链接是inode指向(相当于文件副本,但共享磁盘空间);②软链接可跨分区,硬链接不行;③删除源文件,软链接失效,硬链接仍可用。

实际用软链接场景:比如软件版本升级(/usr/local/jdk软链接指向jdk1.8.0_301,升级时只改软链接指向jdk17,不用改程序配置);日志文件迁移(把/var/log软链接到/data/log,解决根分区空间不足)。

二、核心服务运维

问题:如何搭建Prometheus+Grafana监控服务器CPU、内存、磁盘使用率?关键步骤是什么?

答案:①安装Prometheus:下载二进制包,配置prometheus.yml(添加被监控节点的node_exporter地址);②在被监控节点安装node_exporter(用于采集硬件指标),启动后暴露9100端口;③安装Grafana:启动后访问3000端口,添加Prometheus数据源,导入NodeExporter的官方仪表盘(ID:1860);④配置告警:在Prometheus的alert.rules.yml写规则(比如CPU80%持续5分钟告警),结合Alertmanager推送到企业微信/邮件。

关键验证:Grafana仪表盘能看到CPU使用率曲线,停止node_exporter后Prometheus能检测到“Down”状态。

问题:MySQL数据库备份,增量备份和差异备份有什么区别?如果周一做了全量备份,周二到周四分别做增量/差异备份,周五数据库崩溃,两种备份方式的恢复步骤有何不同?

答案:区别:增量备份只备份“上一次备份后新增的数据”(比如周二备周一到周二的,周三备周二到周三的);差异备份备份“上一次全量备份后新增的数据”(比如周二备周一到周二的,周三备周一到周三的)。

恢复步骤:①增量备份恢复:先恢复周一全量→恢复周二增量→恢复周三增量→恢复周四增量;②差异备份恢复:先恢复周一全量→恢复周四差异(因为周四差异包含了周二到周四的所有数据)。

实际选择:增量备份占用空间小,但恢复步骤多;差异备份恢复快,适合数据量中等的场景。

三、故障排查与处理

问题:线上服务器突然出现CPU使用率100%,请说排查步骤,至少提到3个关键命令。

答案:步骤:①用top命令查看CPU占比最高的进程(按P排序),记录进程ID(比如PID=1234);②用ps-mp1234-oTHREAD,tid,

文档评论(0)

151****9429 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档