离群数据挖掘在电力负荷预测中应用研究.docVIP

下载本文档

5
0
约3.85千字
约 10页
2018-09-16 发布于福建
举报
版权申诉

离群数据挖掘在电力负荷预测中应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

离群数据挖掘在电力负荷预测中应用研究

离群数据挖掘在电力负荷预测中应用研究　　【摘要】电力负荷预测是电力部门的一项重要工作。文章在传统聚类算法――CURE的基础上，引入信息熵的概念，提出了一种新型的电力负荷离群数据挖掘算法，实现了对不良数据的准确辨识和修正，还可为电力调度部门提供有用的信息。　　【关键词】电力负荷预测；离群数据挖掘；聚类分析　　【中图分类号】 TP311 【文献标识码】A 　　【文章编号】1674-1145（2008）02-0130-02 　　　　电力负荷预测是电力系统规划、计划、调度、用电的依据[1]，根据电力负荷历史数据和各类相关影响因素进行预测，预测的精确度很大程度上取决于历史数据的准确性。然而，电力调度自动化系统中各种信息存在着大量的随机信号而具有明显的不确定性(如遥测、遥信信道中的白噪声，电力负荷的随机波动性，故障发生的随机性，开关、保护拒动、误动的发生概率等)，对电力负荷建模和负荷预测造成困扰。因此，为保证负荷预测的精确度，需对历史数据进行坏数据辨识和调整。　　数据挖掘技术作为一个新兴的学科交叉应用领域，提供了充分利用数据中更深层次知识的工具[2]，正在电力系统的决策支持活动中扮演着越来越重要的角色。离群数据挖掘是指从大量的数据中挖掘出明显偏离其它数据、不满足数据的一般行为或模式、与存在的其它数据不一致的数据。　　本文在已有离群数据挖掘算法的基础上，提出了一种改进的电力负荷离群数据挖掘算法――基于信息熵原则的电力负荷离群数据挖掘算法：它根据信息论的基本概念和传统聚类分析算法――CURE，针对电力负荷的特征进行数据挖掘，从有效利用、发掘各种信息和知识的角度查找异常数据；并采用Kohonen网抽取特征负荷曲线来修正异常数据。　　　　一、CURE聚类算法与信息熵　　　　（一）CURE聚类算法　　聚类分析[3]，[4]是采用基于距离的聚类算法，在其分析过程中通常将异常数据作为噪音丢弃掉，没有充分考虑异常数据的作用和影响。CURE算法采用将数据逐个读入的方式进行动态聚类，在进行增量和动态聚类很有效；它采用一系列分布较好的代表性点来表示聚类，这些代表性点能较好地体现聚类形状和程度，然后它们再根据指定的速率收缩到聚类的中心，算法的每一步都是将两个最临近点所涉及的两个聚类进行合并。该算法对于不规则形状的聚类具有较好的聚类效果，处理异常数据效果更佳，但该算法的聚类效果受参数的影响较大，合并点选择不合适时聚类效果差，聚类过程中剔除异常数据引起训练不足导致误检与漏检现象。　　（二）信息熵的定义　　信息论的核心和灵魂是把信息提炼成知识并把知识激活成智能[5]，关心的是随机变量的不确定性，即对这一随机变量进行观察、测量、记录时，其结果具有不确定性。正是由于这种不确定性使得我们对随机变量进行观察、记录、并从中获取信息。“熵”是随机变量不确定性的量度。设有随机变量，　　为该离散随机变量发生的概率，单个离散随机变量所携带的信息量为：　　（1）　　假定X具有N个可能的运动状态，即，各个状态以如下的概率分布出现：，则X所包含的不确定性可以用它所含的信息熵来表征：　　（2）　　观察者获得的信息量可由不确定性（熵）的减少量来表示，熵也就可以作为信息的量度。　　　　二、基于CURE和信息熵的电力负荷离群数据挖掘算法　　　　电力负荷离群数据挖掘是对电力负荷坏数据、不良数据进行识别和校正，包括自然数据补足（如切负荷停电、线路检修停电时的数据补足等）和冲击数据剥离（如大用户、大事件冲击负荷剥离等）。电力负荷数据集一般具有不规则的形状，且含有异常数据，这十分适于用CURE算法进行分析。本文基于CURE算法提出一种新型电力负荷离群数据挖掘算法。　　（一）电力负荷异常数据辨识　　由于电力负荷数据具有明显的周期性和相似性，而工作日负荷和节假日负荷在负荷模式上又不完全一致，因此本文将负荷数据按日期类型分别进行处理。在CURE算法中应用信息熵原则，通过判断数据聚类所携带的信息量是否较好地表征了该数据集合的基本特征来选择聚类过程中的代表性点和合并点。本文离群数据挖掘的基本过程如下：　　1.数据集的产生：负荷数据按日期类型(工作日和节假日)分别处理，并将其规格化，避免日负荷总体水平的高低对聚类的影响，只保留曲线的形状特征。本文中日负荷数据按96分配点采样，从而保证负荷曲线的平滑性。　　 2.聚类参数的选择：负荷数据S随机采样形成n个划分，每个划分大小为；将各子划分区域分别聚类成个子聚类；按信息熵原则选择每个聚类中分布较好的c个代表性点。聚类的质量与初始划分n、初始聚类q和代表性点c相关。为防止聚类的错误合并，应保证每个划分中含足够的数据点，而c的大小应该做到充分体现数据集的几何形