- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
?
智能运维之时间序列分析
?
?
纳粹德国每月生成多少豹式坦克?
如何获得这个重要的情报呢?除了腥风血雨的谍战外,也可以通过统计估计获得。盟军通过研究缴获和被摧毁的坦克,发现轮胎编号为 1 、 2 、 3 等数字,这些数字是车轮模具的上的编号,通过估计模具的数量,推算这些模具可以产生多少轮胎,从而估算出纳粹德国的坦克数量。分析估算 1944 年 2 月可生产 270 辆坦克,大大超过此前预期,该估计与德国战后发布记录 276 辆相近。二战中德国,苏联,盟军都使用过,朝鲜战争也曾被使用过。图1: 豹式坦克,速度快的重型坦克,1944年左右,驻法德军坦克数量的一半为该型号
我们享受这先烈们的披荆斩棘带来的幸福,战争的硝烟已经不再,但股市中红红绿绿的竞争依旧。量化分析人员使用各种统计方法去分析金融产品的价格。 Clive Granger 和 Robert Fry Engle III 使用时间序列分析经济指标而获得 2003 年诺贝尔经济学奖 , Engle 提出的 ARCH 时间序列模型是成果之一。时间序列是经典问题,被广泛研究和广泛应用,特别是金融资产价格预测。
智能运维中的时间序列分析
本次我们介绍智能运维中时间序列分析,它可用于进行系统容量预测,容器编排,例如预测今年“双十一”哪些系统需要增加扩容,购买新的服务器,或者激活服务器中闲置的处理器?数据中心有上千个系统,如何快速发现哪些系统出现异常?可用的统计方法很多,包括概率分布(例如正态分布,泊松分布等),贝叶斯估计、回归等,我们这次讨论最广泛使用的时间序列方法。
什么是时间序列数据?
按时间的先后顺序排列的数据被称为时间序列数据( Time Series Data ),简称时序数据。下图是一个 Docker 容器的空闲内存占比时序数据,其中横轴为时间,纵轴是空闲内存百分比。 ****时序数据通常是以时间来排列数据,但按空间位置排列的数据也称为时间序列数据,使用时间序列分析方法来做分析。和时间序列相对应的是 截面数据 (Cross Sectional Data), 以及将两者结合起来的面板数据 (Panel Data) ,与本次内容无关,有兴趣请查阅任何统计类书籍。
时间序列分析能做什么?
时间序列分析可用在如下的多个场景: ****
1) 根据过去的历史数据预测未来数据。 例如使用历史运维数据,预测未来 CPU 和内存的利用率、磁盘容量、数据库事务数、页面访问量等。例如下面对过去一周 (5 月 10 日到 5 月 17 日 ) 的空闲内存建立模型(如图中绿色阴影部分),预测将来一天 (5 月 18 日 ) 的空闲内存占比情况(如下图红色阴影部分),从图中可以看到系统空闲内存在过去一周以来,呈现持续减少的趋势。2)容量规划。 掌握系统对资源利用率的趋势,预测将来的资源需求。例如 6 个月后哪些系统需要扩容?今年“双十一”需要为哪些系统购买新机器 ?
通过对时间序列折线图进行分解,可得到变化趋势,周期趋势。下面是分解之后得到的结果,其中包含以下三部分内容:
趋势。可以看到空闲内存持续减少。
星期周期。
天周期。
我们也可以通过变化趋势图,找出数据中心中哪些系统的空闲资源在持续下降,从而进行容量规划。我们也利用星期周期和天周期,发现每周或每天系统的繁忙或空闲情况,通过精心选择将一些系统部署在一台服务器,达到 “填谷削峰”的效果。
如果需要也可以分析节假日对时序数据的影响,下面分析结果了 2015 到 2016 年一年多时间中,节假日对 CPU 利用率的影响因素。3)?异常检测。 发现哪些系统的运行数据偏离正常范围 ( 大幅突然偏离或持续逐渐偏离 ) 。使用时间序列分析方法,可预测未来数据的走向,然后通过比较当前系统运行指标和预测指标之间的差异,分析二者的偏离情况,发现系统突变异常和持续偏离异常。
下面系统运行指标突然偏离预测值,系统发生了突变:
| 图表 2陡变异常 |
以下系统指标逐渐偏离预测值:
时间序列分析的模型概述
时间序列分析可使用模型非常多,难度稍大,部分模型如下:
移动平均和加权移动平均。股票软件中的 30 日线, 60 日线是移动平均线。
指数平滑法。预测时距离预测值远的点影响程度呈指数下降。
Holt-Winters( 三次指数平滑法 )
ARIMA 。 差分移动平均自回归模型
LSTM 。长短时循环神经网络
另外, Facebook 在 2017 年发布了 prophet 组件,算法创新不大,但支持 Python 和 R 语言,使用方便,本文使用 Prophet 来做时序预测。
?
-全文完-
您可能关注的文档
- 智能照明模块的功能作用及分类概述.docx
- 智能照明系统如何让你的房屋更智能.docx
- 智能电网的重要意义解读.docx
- 智能电表有什么优势智能电表的优势.docx
- 智能电视主要接口介绍.docx
- 智能电视常见的接口介绍.docx
- 智能百科-什么是视频元数据.docx
- 智能空调-智能家居生活发展分析.docx
- 智能穿戴设备心率监测实现的几种方法及原理.docx
- 智能穿戴设备无线充电接收解决方法图解.docx
- 2026湖南长沙市怡海中学公开招聘应届毕业生27人参考考试题库及答案解析.docx
- 2025年江西中医药大学第二附属医院招聘编制外工作人员6人(第四批)模拟笔试试题及答案解析.docx
- 2025年铜川市宜君县高级中学招聘(4人)备考考试试题及答案解析.docx
- 第九单元课题1溶液及其应用课件-2025-2026学年九年级化学人教版下册.pptx
- 2025福建厦门市集美区诚毅中学英语产假顶岗教师招聘1人模拟笔试试题及答案解析.docx
- 2026河南省定向重庆大学选调应届优秀毕业生参考考试试题及答案解析.docx
- 2025新疆和田地区“才聚和田·智汇玉都”招才引智招聘工作人员204人备考笔试试题及答案解析.docx
- 2026广东省面向东北师范大学选调优秀大学毕业生备考笔试试题及答案解析.docx
- 2025 年大学药学(药物合成反应)上学期期末测试卷.doc
- 2025年福建省厦门大学嘉庚学院办公室文秘岗位招聘参考笔试题库附答案解析.docx
原创力文档


文档评论(0)