CN106909793-CN201710122793-检验服从近似正态分布的时间序列的异常的方法.pdfVIP

CN106909793-CN201710122793-检验服从近似正态分布的时间序列的异常的方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN106909793-CN201710122793-检验服从近似正态分布的时间序列的异常的方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 106909793 A (43)申请公布日 2017.06.30 (21)申请号 201710122793.8 (22)申请日 2017.03.03 (71)申请人 北京北青厚泽数据科技有限公司 地址 100016 北京市朝阳区朝阳北路145号 13号楼(六里屯孵化器2166号) (72)发明人 夏一粟 刘红跃  (74)专利代理机构 北京德和衡律师事务所 11405 代理人 王晓 (51)Int.Cl. G06F 19/00(2011.01) 权利要求书1页 说明书5页 附图1页 (54)发明名称 检验服从近似正态分布的时间序列的异常 的方法 (57)摘要 本发明提供了一种检验服从近似正态分布 的时间序列的异常的方法,包括:步骤1,获取关 键管理指标的按时间顺序排列的历史数据;步骤 2,生成所述关键管理指标的正态概率图;步骤3, 根据所述正态概率图判断所述关键管理指标的 数据是否存在潜在的异常值,如果有,则进入步 骤4;步骤4,根据广义ESD统计检验时间序列是否 存在异常值。通过本发明中的技术方案可科学地 定义出异常模式,并实现异常模式的自动检测、 及时发现异常,不需要管理者具有一定的管理经 验,降低了对管理者的要求,可复制性好,增加了 A 预测的科学性和合理性。 3 9 7 9 0 9 6 0 1 N C CN 106909793 A 权 利 要 求 书 1/1页 1.一种检验服从近似正态分布的时间序列的异常的方法,其特征在于,包括: 步骤1,获取关键管理指标的按时间顺序排列的历史数据; 步骤2,生成所述关键管理指标的正态概率图; 步骤3,根据所述正态概率图判断所述关键管理指标的数据是否存在潜在的异常值,如 果有,则进入步骤4; 步骤4,根据广义ESD统计检验时间序列是否存在异常值。 2.根据权利要求1所述的方法,其特征在于,步骤2包括: 步骤21,将每个关键管理指标的数据分别由小至大排列,并分别按1-n编号; 步骤22,计算每个数据的分位数; 步骤23,确定与每个分位数匹配的正态分布值; 步骤24,根据上述每个数据的值及其对应的分位数的正态分布值生成散点图,其中,该 散点图的X轴为所述正态分布值,Y值为所述数据的值; 步骤25,采用一条直线拟合所述散点图中的数据点,生成正态概率图。 3.根据权利要求2所述的方法,其特征在于,所述步骤3包括: 计算所述散点图中的数据点与所述直线之间的相关系数,如果相关系数小于预定值, 则认为存在异常值。 4.根据权利要求2所述的方法,其特征在于,所述步骤4包括: 步骤41,确定异常值的个数r或占比a; 步骤42,计算步骤3中确定的每个异常值对应的统计量、以及该异常值在给定的显著水 平下的临界值; 步骤43,若该异常值的统计量大于临界值,则该异常值对应的数据是所述关键管理指 标的异常值。 5.根据权利要求4所述的方法,其特征在于,所述步骤42根据下式计算所述统计量: 其中,R 为统计量,为样本均值,S为样本标准差,xi为时间序列中的数据值。 i 6.根据权利要求4所述的方法,其特征在于,所述步骤42在显著性水平为α的条件下,根 据下式计算所述临界值: 其中,λ 为临界值,t 为自由度为n-i-1的t分布的100p百分位点,且 i

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档