- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析1
主成分分析 主要讲基本思想,原理及运用 一、主成分分析的原理简介 主成分分析的的原理就是利用降维的思想,通过线性变换,在损失很少的信息的条件下,把多个存在线性相关的指标转化为几个线性无关的综合指标,简化指标的数目,保留原始变量的绝大部分信息。全面、准确的反映出事物的特征及发展规律。 在研究多变量(即描述样本的指标)问题时,变量太多会增加计算量和增加分析问题的复杂性。人们自然希望在进行定量分析的过程中,涉及的变量较少,而得到的信息量有较多,主成分分析是解决这一问题的理想工具。 二、主成分分析的几何意义 主成分分析的几何意义 三,运用 主成分分析法 定义:主成分分析法(PCA),是 1933 年由 Hotelling 首先提出,是把多指标转化为少数几个综合指标的多元统计分析方法。 主成分分析综合评价法的步骤 主成分分析综合评价法的步骤 主成分分析综合评价法的步骤 主成分分析综合评价法的步骤 主成分分析综合评价法的步骤 验证实例 为全面、系统地分析评价火电机组运行状态,往往要考虑众多影响因素即指标,多指标大样本无疑会提供丰富的信息,但也在一定程度上增加了问题分析的复杂性;同时每一个指标都在不同程度上反映了机组运行状态的某些信息. 鉴于各个指标之间往往存在一定的相关性,反映的信息在一定程度上有重叠;单指标虽然可以用来比较机组运行的状况,但不同指标下的结果可能不一致,易出现矛盾,因此,有必要寻找一个或几个较少的综合指标来综合各方面的信息。这些较少的几个综合指标不相关,所包含的信息不重叠又较丰富,用较少的综合指标对汽轮机组运行状态进行分析评价,容易抓住主要矛盾,简化评价工作 ,往往取得意想不到的良好效果。主成分分析方法为实现这一思想提供了十分有效的数学方法。我们利用主成分分析法对火电机组运行状态进行综合分析评价,取得了较好的评价结,对进一步开展电厂机组的综合评价有一定的参考价值。.表 1 为某机组不同运行负荷下的主要运行参数, 我们以此事例探索运用主成分分析法建立综合评价模型,评价不同负荷下的运行情况。 验证实例 验证实例 验证实例 验证实例 验证实例 验证实例 从上表可看出,综合评价函数值(一个新的指标)可代表主汽压、主汽温度、再热汽温、再热压力、给水温度、真空度等 6 个指标所反映的机组状态变化,且信息的损失量很小,评价的可信度为 96.21%该指标的分析可知,该指标能够综合反映机组的一种运行状态。这样,利用该新指标,可对机组运行状态进行量化和对比。如果再综合考虑与运行状态有关的其它指标,也可得到一个新的综合指标,且保证新指标的信息损失量在可接受的范围内。可见,利用主成分分析法,可对多方面的信息进行综合,从而获得一个可量化评价机组状态的指标, 有利于机组的状态监测、故障诊断。 四)用SPSS快速实现主成分分析 在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,涉及9项指标,原始数据如下: X1:百万元固定资产原值实现值(%); X2:百万元固定资产原值实现利税(%); X3:百元资金实现利税(%); X4:百元工业总产值实现利税(%); X5:百元销售收入实现利税(%); X6:每吨标准煤实现工业产值(元); X7:每千瓦时电力实现工业产值(元); X8:全员劳动生产率(元/人.年); X9:百元流动资金实现产值(元)。 首先,标准化原始数据,标准化后的数据见下表 2、将标准化数据导入SPSS软件。用factor analysis 1)相关系数矩阵 贡献率及累积贡献率 碎石图 特征向量 分析各样品在主成分所反映的经济意义的情况 将标准化后的原始数据带入主成分表达式,计算出各样品的主成分得分,由各个样品的主成分得分就可在2维空间中描绘各*样品的分布情况。 28省主成分得分分布散点图 由上图可看出,分布在第一象限的是上海、北京、天津、广西这4个地区,这4各地区的经济效益在全国来说是比较好的,其中上海的经济效益最好。分布在第四象限的是江苏、浙江、安徽、福建、山东、湖北、广东7省。因为第4象限的主要特征是第一主成分,第一主成分占的信息总量比重最大,所以这7 歌声的经济效益也算比较好的。分布在第二和第三象限的地区可划为同一类,经济效益较差。 小结 有关主成分的实际意义,要结合具体问题和有关专业知识才能给出合理的解释。虽然利用主成分本身可对所研究的问题在一定程度上作分析,但主成分分析本身往往并不是终极目的,更重要的是利用主成分综合原始变量的信息,达到降维的目的,减少指标之间的相关性,然后对数据做进一步分析,如回归分析,聚类分析、判别分析等 拂脖毁姻芬野址欺崔欣外民蛇穗滨行手滑狙周融已哩壮脾青扰幌链跑鸳一主成分分析1主成分分析1 * 速腐躺升丁彪强玖浅悯揖揭湛复魄刷科喊吠娠缨晰此刹豪
文档评论(0)