数据挖掘项目电力窃漏电用户自动识别.pdfVIP

数据挖掘项目电力窃漏电用户自动识别.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘项目电力窃漏电用户自动识别.pdf

1.数据预处理 数据集:/s/1kUXWhWN 1)填充excel 中缺失数据,(文件:missing_data.xls) ABC 分别代表三个用户一个月工作日用电量数据 完整代码: #-*- coding: utf-8 -*- #拉格朗日插值代码 import pandas as pd #导入数据分析库Pandas from erpolate import lagrange #导入拉格朗日插值函数 inputfile = missing_data.xls #输入数据路径,需要使用Excel 格式; outputfile = missing_data_processed.xls #输出数据路径,需要使用Excel 格式 data = pd.read_excel(inputfile, header=None) #读入数据 #自定义列向量插值函数 #s 为列向量,n 为被插值的位置,k 为取前后的数据个数,默认为5 def ployinterp_column(s, n, k=5): y = s[list(range (n-k, n)) + list(range (n+1, n+1+k))] #取数 y = y[y.notnull ()] #剔除空值 return lagrange(y.index, list(y))(n) #插值并返回插值结果 # #逐个元素判断是否需要插值 for i in data.columns: for j in range (len(data)): if (data[i].isnull())[j]: #如果为空即插值。 data[i][j] = ployinterp_column(data[i], j) data.to_excel(outputfile, header=None, index=False) #输出结果 2)数据变换 A.电量趋势下降指标:对统计当天设定前后5 天为统计窗口期,计算这11 天内电 量趋势下降情况,其中第i 天用电量趋势是考虑前后5 天期间的用电量斜率。 公式如下: i5 ( f  f )(l l) l k  l i5 i i5 (l l)2 l i5 1 i5 f =  fl 11 l i5 1 i 5 l= l 11 l i5 Ki 为第i 天的电量趋势, 为第L 天的用电量 fl 若电量趋势为不断下降的,则认为具有一定的窃电嫌疑,故计算这11 天内,当天 比前一天用电量趋势为递减的天数,即设有: 1, k  k i i1 D( )   i 0, k  k  i i1 则这11 天内的电量趋势下降指标为 i5 T  ( )  D n ni4 B.线损指标:线损率用于衡量供电线路的损失比例。一条线路上同时供给多个用 户,若第l 天的线路供电量为S ,线路上各个用户的总用电量为 f (m ) ,线路的线 L

您可能关注的文档

文档评论(0)

zhoujiahao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档