基于改进快速密度峰值聚类算法的电力大数据异常值检测.PDF

基于改进快速密度峰值聚类算法的电力大数据异常值检测.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ELECTRIC POWER ICT 中图分类号:TP312 文献标志码:A 文章编号:2095-641X(2017)06-0036-06 DOI:10.16543/j.2095-641x.electric.power.ict.2017.06.007 基于改进快速密度峰值聚类算法的 电力大数据异常值检测 刘凤魁 ,邓春宇 ,王晓蓉 ,王新迎 (中国电力科学研究院 ,北京 100192 ) 摘要:异常值检测是数据挖掘的一个重要分支。在 电力行业 ,异常值检测可用于电网故障检测、 设备故障检测、用 电异常检测等领域。文章根据 电力大数据的特点 ,研究适用于电力大数据的 异常值检测算法。针对快速密度峰值聚类算法用于异常值检测时未考虑数据的局部特点 以及 局部密度依赖于截断距离选取的不足 ,利用 KNN(K-Nearest Neighbors )思想重新定义局部 密度和距离 ,提 出了基 于 KNN 的快速密度峰值异常值检测算法 ,从而实现更加准确 的异常值 检测 ,并基于某省配电变压器的 日负荷数据异常检测仿真实验证明了该算法的有效性。 电 关键词:电力大数据;异常值检测;KNN 算法;密度聚类 力 大 数 0 引言 方法 ,这种方法效率低 而且 浪费人力物力 资源 ,而通 据 过数据 的方法进行异 常检测有助 于 自动锁定异 常事 在 能 源行 业 ,智 能 电 网是 大数 据 应 用 的重要 技 件 ,提 高异 常事 件 的查 处命 中率 ,降低 稽 查 成 本 ,同 术 领 域 之 一 。随着 智 能 电 网 的建设 与发 展 ,发 、输 、 时还可 以降低 电网企业 的经济损失 [6] 。 变 、配 、用 和调度六 大环节安装 和部署 了众 多 的数据 目前 ,已经有很 多异 常值检测方法 ,如基 于统计 采集装置 ,并配套建设 了相应 的信息管理系统 。这些 的异 常值检测 、基 于聚类 的异 常值检测 、基 于分类 的 信 息 系统 产 生 和管 理 着 大量 规模 巨大 、结 构 多样 的 异 常值 检测 、基 于近邻模 型 的异 常值 检测 等 [7-8] 。基 数 据 ,是 电力 大数 据 的主要 来 源 。 电力 大数 据 可 以 于统计 的异 常值检测方法认 为数据集 的分 布符合某 应 用 于 电 网 的各 个 环 节 ,如 电 网规 划 、新 能 源并 网、 个 概 率 分 布模 型 ,对 于不 符 合 该 模 型 的样 本 点会 被 需 求 侧 管 理 等 。通 过 对 配用 电大数 据 的有 效 挖 掘 , 判定 为异 常值 。文献 [9] 介 绍 了一 种有参 数 的统计 可有力促进 电网从 以传统物理模 型为核心 的业务模 异 常值 检测 方 法 ,文献 [10] 介 绍 了一 种无

您可能关注的文档

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档