云计算平台运行维护云资源监控实施指南.docxVIP

云计算平台运行维护云资源监控实施指南.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1

云计算平台运行维护云资源监控实施指南

1范围

本文件规定了云计算平台运行维护过程中云资源监控的实施指南,包括监控指标体系、监控方法、监控频率、告警管理等方面的要求。本文件适用于辽宁省内各类云计算平台的运行维护管理,涵盖公有云、私有云和混合云等不同部署模式的云计算平台。

本文件旨在为云计算平台运营单位提供一套规范、统一的云资源监控实施标准,确保云计算平台的稳定运行,提高资源利用效率,及时发现和解决潜在的问题,保障业务连续性。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T37938—2019信息技术云资源监控指标体系

GB/T37736—2019信息技术云计算云资源监控通用要求GB/T31167—2023信息安全技术云计算服务安全指南

GB/T31168—2023信息安全技术云计算服务安全能力要求GB/T37739—2019信息技术云计算平台及服务部署要求

GB/T37972—2019信息安全技术云计算服务运行监管框架

3术语和定义

下列术语和定义适用于本文件。

3.1

云计算平台cloudcomputingplatform

提供云计算服务的基础设施和软件系统的集合,包括计算、存储、网络、安全等资源,以及相应的管理和调度机制。参考国家标准中的定义,并结合辽宁省实际应用场景,强调云计算平台在本地的应用特点和重点关注方面。

3.2

云资源cloudresources

云计算平台中可供使用的各种计算、存储和网络资源,包括物理资源和虚拟资源。对物理资源和虚拟资源分别进行详细解释,明确其涵盖的具体内容,如物理服务器、存储设备、网络设备以及虚拟机、虚拟网络等。

3.3

监控monitor

对云计算平台中的云资源进行实时或定期的数据采集、分析和处理,以获取资源的使用状态和性能指标,并及时发现异常情况的过程。阐述监控在云计算平台运行维护中的重要性和作用机制。

4总则

2

在本文件中,物理资源监控指标监控的对象是提供基础设施能力类型的云服务所需要的资源,包括物理服务器、存储设备、网络设备等。虚拟资源监控指标监控的对象是提供平台能力类型的云服务所需要的虚拟资源,包括虚拟机、虚拟网络等虚拟资源。应用服务监控指标监控的对象是提供应用能力类型的云服务所需要的资源,包括各类应用系统。

本文件中对云资源的监控通用要求包括技术要求和管理要求。如图1所示,监控技术要求从云服务提供者角色和云服务客户角色出发,针对物理资源监控指标、虚拟资源监控指标、应用服务监控指标分别提出相应要求。

图1云资源监控指标技术要求框架

5监控指标体系

5.1物理资源监控指标

5.1.1服务器

服务器主要应包括:

a)CPU使用率:定义为服务器CPU在某一时间段内处于繁忙状态的时间比例。正常范围一般在0%-80%(可根据服务器配置和业务需求进行调整),当使用率超过设定的告警阈值(如90%)时,可能表示服务器负载过高,需要进一步分析原因,如是否存在大量计算任务同时运行或某个应用程序出现异常;

b)内存使用率:指服务器内存被占用的比例。正常范围通常在0%-70%左右,告警阈值可设为80%。过高的内存使用率可能导致系统性能下降,出现内存溢出等问题;

c)磁盘I/O速率:反映磁盘读写数据的速度。单位通常为MB/s或KB/s,正常范围因磁盘类型和业务需求而异,一般来说,对于机械硬盘,顺序读写速率在几十MB/s到上百MB/s之间,随机读写速率较低;对于固态硬盘,顺序读写速率可达数百MB/s甚至更高。当磁盘I/O速率低于正常范围下限或高于上限时,可能表示磁盘存在故障或负载过高;

d)网络带宽利用率:表示网络接口实际使用的带宽与总带宽的比值。正常范围一般在0%-70%,超过80%可能意味着网络出现拥堵,需要检查网络设备和应用程序的网络使用情况;

e)GPU使用率:表示GPU当前工作负载的百分比,合理范围因使用场景而异。日常使用时,合理范围约为10%-30%,而游戏或专业应用时,70%-100%是正常的。使用率过高可能指示系统运行重负载任务或存在故障,可能导致性能问题;使用率过低则可能意味着GPU未被充分利用或驱动程序有问题,影响系统配置适宜性;

3

f)磁盘使用率:指服务器磁盘被占用的比例。正常范围通常在0%-90%左右,告警阈值可设为90%。过高的磁盘使用率可能导致数据丢失或无法写入新数据。

5.1.2存储设备

存储设备应包括:

a)存储容量使用率:计算存

文档评论(0)

法律咨询 + 关注
实名认证
服务提供商

法律职业资格证、中级金融资格证持证人

法律咨询服务,专业法律知识解答和服务。

版权声明书
用户编号:8027066055000030
领域认证该用户于2023年04月14日上传了法律职业资格证、中级金融资格证

1亿VIP精品文档

相关文档