聚类-主成分分析.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类-主成分分析

主成分-聚类分析法在管道风险评价中的应用摘要:管道在运行过程中面临着多种风险,对管道所面临的风险进行一定的统计分析可以更精确地分析得出不同风险段的不同风险因子对评价结果的影响程度。本文按照管段实际情况选择有差异的10个风险指标X1(埋深),X2(壁厚),X3(人口密度),X4(公众态度),X5(上方活动),X6(阴保电流),X7(土壤腐蚀),X8(杂散电流),X9(敷设方式),X10(土体类型)建立风险评价流程,通过标准化,主成分分析和聚类分析,降低了管道风险指标间的相关性和赋权主观性,提取了管道风险指标的3个主成分因子,然后结合指标间的相关性,最终得出了管段的风险分类和排序。这可以提高提高管道风险评价体系的可靠性和实用性,具有实际的意义。关键词:油气管道、风险评价、主成分分析、聚类分析1 问题背景管道风险评价作为管道风险管理的基础,其目的是通过计算某段或整条管道系统的风险值对各个管段或整条管道进行风险排序,以识别高风险部位,确定那些最大可能导致管道事故和有利于事故预防的至关重要的因素,确定管段的优先次序,为维护活动经济性的决策提供依据,最终使管道的运行管理更加科学化。主成分分析法从数据的内部结构出发,通过数学变化产生综合评价指标涉及的赋权,减弱了多指标综合评价体系中的主观性影响。聚类分析是依据数据相似度,将大量数据点的集合分成若干类,使得每个类中的数据间最大程度地相似,而不同类中的数据最大程度地不同。采用主成分-聚类分析法开展管道风险评价,在消除管道风险评价指标信息重叠和主观性的同时,实现依据风险指标对管道管段的排序、归类,为管道风险管理,维抢修物资、人员的配置提供科学依据。2 方法模型2.1 主成分分析主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。Fp = a1i*ZX1 + a2i*ZX2 + …… + api*ZXp,其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化。A=(aij)p×m =(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥ …≥λp≥0。主要步骤1.指标数据标准化(SAS软件自动执行);2. 指标之间的相关性判定;3. 确定主成分个数n;4. 主成分Fi表达式;5. 主成分Fi命名;2.2 聚类分析聚类分析的目标就是在相似的基础上收集数据来分类。聚类分析发展至今,有许多种不同的聚类方法,其中应用得最多、最成熟的方法为系统聚类法和K - means 聚类法。在此采用系统聚类法,其基本思想为:首先将一定量的指标和变量各自视作一类,然后根据指标间的亲疏程度,合并相关性较高的类,之后考虑合并后的类与其他类之间的亲疏程度,再进行合并,以使得类别内数据的差异尽可能小,类别间数据的差异尽可能大。3 实际应用本文选取某输气管道部分管段进行风险评价研究,管道直径 660 mm,最小壁厚7.1mm,最大操作压力为6.3MPa,全线长200km,埋深大部分超过1.5m,管道沿线有第三方工程施工,操作人员均经过培训。根据综合评价方法模型,按照图1流程开展评价工作。采用基于肯特评分法对风险因素X1(埋深),X2(壁厚),X3(人口密度),X4(公众态度),X5(上方活动),X6(阴保电流),X7(土壤腐蚀),X8(杂散电流),X9(敷设方式),X10(土体类型)进行评分(表1)。表1 管道风险因子量化评分结果3.1评价指标标准化为避免因各指标量纲的不同而缺乏可比性,首先按照下述公式对原始评价数据标准化(表2),标记为x1,x2

文档评论(0)

ccx55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档