CN106951353-CN201710165906-作业数据异常检测方法及装置.pdfVIP

CN106951353-CN201710165906-作业数据异常检测方法及装置.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN106951353-CN201710165906-作业数据异常检测方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 106951353 A (43)申请公布日 2017.07.14 (21)申请号 201710165906.2 (22)申请日 2017.03.20 (71)申请人 北京搜狐新媒体信息技术有限公司 地址 100084 北京市海淀区中关村东路1号 院9号楼搜狐网络大厦8层802 (72)发明人 王蕾 乔帅  (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 王宝筠 (51)Int.Cl. G06F 11/30(2006.01) G06F 17/30(2006.01) 权利要求书3页 说明书9页 附图4页 (54)发明名称 作业数据异常检测方法及装置 (57)摘要 本发明实施例提供了一种作业数据异常检 测方法及装置,可以获得多种作业数据;从所述 多种作业数据中去除冗余数据,得到待检测的多 种作业数据;确定所述待检测的多种作业数据中 的作业数据种类数量是否不大于第一预设阈值, 如果是,则将所述待检测的多种作业数据中每一 种作业数据作为多维组合的一个维度,将所有维 度构成的多维组合放入结果空间集合中;确定所 述结果空间集合中的为离群点的多维组合,将为 离群点的多维组合确定为异常数据。本发明首先 将异常作业数据视为某段时间内所有作业数据 中的离群点。本发明将作业数据的分析从一维扩 A 展到多维,使得异常作业数据的检测不再受单指 3 标的局限。 5 3 1 5 9 6 0 1 N C CN 106951353 A 权 利 要 求 书 1/3页 1.一种作业数据异常检测方法,其特征在于,包括: 获得多种作业数据; 从所述多种作业数据中去除冗余数据,得到待检测的多种作业数据; 确定所述待检测的多种作业数据中的作业数据种类数量是否不大于第一预设阈值,如 果是,则将所述待检测的多种作业数据中每一种作业数据作为多维组合的一个维度,将所 有维度构成的多维组合放入结果空间集合中; 确定所述结果空间集合中的为离群点的多维组合,将为离群点的多维组合确定为异常 数据。 2.根据权利要求1所述的方法,其特征在于,所述确定所述结果空间集合中的为离群点 的多维组合,包括: 确定所述结果空间集合中的多维组合的近邻点; 确定所述结果空间集合中的多维组合的局部密度及近邻点的局部密度; 基于所述多维组合的局部密度及近邻点的局部密度确定所述结果空间集合中的多维 组合的局部异常值因子LOF值; 将所述LOF值大于1的多维组合确定为离群点。 3.根据权利要求2所述的方法,其特征在于,所述确定所述结果空间集合中的为离群点 的多维组合,还包括: 按照所述LOF值对所述结果空间集合中的各多维组合进行排序。 4.根据权利要求1所述的方法,其特征在于,所述冗余数据,包括以下多种数据中的一 种或多种: 非数值型数据; 常量型数据; 方差为零的数据; 同一种作业数据中的最大值; 同一种作业数据中的最小值。 5.根据权利要求1至4中任一项所述的方法,其特征在于,在确定所述待检测的多种作 业数据中的作业数据种类数量大于第一预设阈值时,所述方法还包括: 将所述待检测的多种作业数据中每一种作业数据作为多维组合的一个维度,将各种二 维组合的二维数组放入候选空间集合中; 确定所述候选空间集合中每种二维组合的二维数组的皮尔逊相关系数P; 将所述P大于第二预设阈值的二

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档