- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
探讨数据挖掘和神经网络技术电力工程造价应用
探讨数据挖掘和神经网络技术电力工程造价应用 【摘 要】文章讨论采用神经网络方法和数据挖掘技术来对电力工程造价进行预测及审查。神经网络模糊系统确立电力工程造价的预测方法,数据挖掘技术在属性聚类和优选、数据预处理方面得到规则。通过对实例的分析和计算,在电力工程造价的预测和审查方面,该方法达到突出的效果,同时验证了该方法的收敛性以及预测准确性。 【关键词】预测;电力工程造价;神经网络;数据挖掘 对于以往工程项目造价的预测而言,多数情况下都是依靠经验丰富的工作人员根据实际经验的积累来进行推测和分析的。其实工程造价是一个非线性、多变量的复杂过程。人们从现有的数据中挖掘出隐藏在其中未知的、却是有用的知识和信息,并且将它变成最终能够被人们所理解的模式,这个过程就是数据挖掘。通过极其完善和丰富的连接,大量神经元构成了自适应且非线性的动态系统,该系统就是人工神经网络。其具有良好的非线性映射能力,还具备了传统建模方法所没有的许多优点。通过学习评价结果以及方案,就能够得到隐藏在其中的人的知识经验、直觉思维。当评价时,网络可以对复杂问题做出合理的判断,在线这些直觉思维、知识与经验等。这样,既减少了在评价过程中出现的主管因素影响,又充分地利用了以往工程中的知识和经验。为了证实该方法的可行性和有效性,将人工神经网络与数据挖掘相结合,以电力线路工程多指标相互作用影响造价这一特点为基础,对电力工程造价的问题进行研究。 1数据的预处理 在数据挖掘中,有一项重要的技术便是数据预处理。数据的预处理与数据挖掘过程中的可执行性及其合理的结果之间的关系密不可分。在电力线路中,绝缘子、运距、杆塔、档距、地形、电压的等级等存在的差异都会给工程造价带来多个因素的影响。而且,其影响造价的因素都有子因素,我们将其称之为层次数据仓库,如图所示。对工程以往数据进行预处理时,具体方法有:压缩数据集、平滑噪声数据、填补空缺值等等。这些造价因素不但与数据挖掘的任务没有关系, 还会造成将大量时间浪费在数据挖掘的过程中,这种属性间的重复强化会带来失真的计算结果。我们需要选择适合的属性来减少数据存取的时间,与此同时也极大程度上提高了对挖掘结果的可理解性。我们就来看看现在属性的两个步骤。①对原始数据集进行压缩时采用属性转换及属性归约等方式。例如:采用加权平均的方式将平底、丘陵、一般山地、高山大岭等原统计数据对地形的描述属性转换成为地形系数属性。地形系数的计算方法为:{W1×高山大岭比例+W2×一般山地比例+W3×丘陵比例+W4×平地比例}=地形系数。相关领域的专家可以对公式中的W1,W2,W3,W4对应地形的权系数进行设定。②更深层次的属性优选需要恰当的算法,例如:过滤算法、包装算法等的启发式搜索算法。我们可以采用包装算法按照电力线路工程数据的特点,通过两次实验分别离散化截面和电压作为类别属性,截面和电压是对单位工程造价影响最为明显的两个属性。最终的优选子集可以使用两次实验的交集。 2神经网络和数据挖掘的工程造价预测 针对不同的数据结构和类型,作为对象相似性度量标准,K-means聚类方法选择了不同的距离函数。常用的度量方法是基于欧式距离的度量法。工程造价的模糊规则采用聚类方法进行生成。将具备相似性的工程归纳为一组,相似性不是指绝对数值的大小,二十属性之间相对大小。余弦距离反映出向量内部元素的变化状况以及向量之间的相似关系,所以,作为对象相似度的度量标准来说,选用余弦距离符合实验要求。余弦距离的度量形式为, ,公式中的 和 为 、 的第 个属性。选择聚类数目在聚类分析中也是关键,它需要考虑到系统的复杂度和精度。选择适合的聚类数目时,要依据指标所减小的程度,通过观测平方误差和的变化来逐步改变聚类数目。选择2为聚类数目,能使模型的精度得以提高,并使系统保持一定的精度且不过于复杂。 在实际的问题中,输入划分输入空间为非线性的,要使模糊规则数量急剧上升,就需要对细致划分输入空间。因此,以神经网络的模糊系统模型为基础,通过模糊系统训练得到多维的非线性的隶属度函数是该模型的思想。将样本用聚类方式分组,每组都是一条模糊规则。各个样本通过模糊BP网络训练,对于规则的适应度函数进行各类输入、输出神经网络分别训练,最后在系统的输出中合成各网络的输出。 BP算法存在一些缺陷:对已学习完成的样本而言,新加入的样本会对其产生影响;往往需要依靠经验来选取连接权初值和网络隐层神经元数目;能量函数存在局部极小值;反向传播算法需要成千上万次的迭代计算,其收敛的速度较慢。为了弥补上述不足,可以采用计算精度高、收敛速度快的Levenberg-Marquardt规则算法来进行对前向网络的训练。Levenberg-Marquardt算法步骤为:选取初始权值;将样本指标信息输入所有样本,包括:a.对
您可能关注的文档
最近下载
- 1 爱的细节PPT_HSK5 标准教程上.pptx VIP
- 体育与健康《运动负荷的自我监测》教学课件 (6).pptx VIP
- 综合项目工程进度款支付审批作业流程.doc VIP
- 【新教材】2025-2026学年湘美版(2024)美术二年级上册全册教案(教学设计).pdf
- 1 看图讲故事:中华人民共和国成立了 教学设计 2025岭南版美术一年级上册.doc
- 植物群落物种共存机制.pptx VIP
- 2025入党申请书___5篇.docx VIP
- 三角函数与导数的结合.pdf VIP
- Unit 3 Fascinating Parks 词汇讲义(无答案) 2020-2021学年人教版高中英语选择性必修第一册.doc VIP
- 三角函数与导数结合.pdf VIP
文档评论(0)