网站大量收购独家精品文档,联系QQ:2885784924

主成分分析课件.pptVIP

主成分分析课件.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

§4主成分的性質一、均值二、方差為所有特徵根之和說明主成分分析把P個隨機變數的總方差分解成為P個不相關的隨機變數的方差之和。協方差矩陣?的對角線上的元素之和等於特徵根之和。三、精度分析1)貢獻率:第i個主成分的方差在全部方差中所占比重,稱為貢獻率,反映了原來P個指標多大的資訊,有多大的綜合能力。2)累積貢獻率:前k個主成分共有多大的綜合能力,用這k個主成分的方差和在全部方差中所占比重來描述,稱為累積貢獻率。我們進行主成分分析的目的之一是希望用盡可能少的主成分F1,F2,…,Fk(k≤p)代替原來的P個指標。到底應該選擇多少個主成分,在實際工作中,主成分個數的多少取決於能夠反映原來變數80%以上的資訊量為依據,即當累積貢獻率≥80%時的主成分的個數就足夠了。最常見的情況是主成分為2到3個。四、原始變數與主成分之間的相關係數

可見,和的相關的密切程度取決於對應線性組合係數的大小。五、原始變數被主成分的提取率前面我們討論了主成分的貢獻率和累計貢獻率,他度量了F1,F2,……,Fm分別從原始變數X1,X2,……XP中提取了多少資訊。那麼X1,X2,……XP各有多少資訊分別F1,F2,……,Fm被提取了。應該用什麼指標來度量?我們考慮到當討論F1分別與X1,X2,……XP的關係時,可以討論F1分別與X1,X2,……XP的相關係數,但是由於相關係數有正有負,所以只有考慮相關係數的平方。如果我們僅僅提出了m個主成分,則第i原始變數資訊的被提取率為:是Fj能說明的第i原始變數的方差是Fj提取的第i原始變數資訊的比重主成分分析一項十分著名的工作是美國的統計學家斯通(stone)在1947年關於國民經濟的研究。他曾利用美國1929一1938年各年的數據,得到了17個反映國民收入與支出的變數要素,例如雇主補貼、消費資料和生產資料、純公共支出、淨增庫存、股息、利息外貿平衡等等。§1基本思想在進行主成分分析後,竟以97.4%的精度,用三新變數就取代了原17個變數。根據經濟學知識,斯通給這三個新變數分別命名為總收入F1、總收入變化率F2和經濟發展或衰退的趨勢F3。更有意思的是,這三個變數其實都是可以直接測量的。斯通將他得到的主成分與實際測量的總收入I、總收入變化率?I以及時間t因素做相關分析,得到下表:?F1F2F3IItF11?????F201????F3001???I0.995-0.0410.057l??I-0.0560.948-0.124-0.102l?t-0.369-0.282-0.836-0.414-0.1121主成分分析是把各變數之間互相關聯的複雜關係進行簡化分析的方法。在社會經濟的研究中,為了全面系統的分析和研究問題,必須考慮許多經濟指標,這些指標能從不同的側面反映我們所研究的對象的特徵,但在某種程度上存在資訊的重疊,具有一定的相關性。主成分分析試圖在力保數據資訊丟失最少的原則下,對這種多變量的截面數據表進行最佳綜合簡化,也就是說,對高維變數空間進行降維處理。很顯然,識辨系統在一個低維空間要比在一個高維空間容易得多。(1)基於相關係數矩陣還是基於協方差矩陣做主成分分析。當分析中所選擇的經濟變數具有不同的量綱,變數水準差異很大,應該選擇基於相關係數矩陣的主成分分析。在力求數據資訊丟失最少的原則下,對高維的變數空間降維,即研究指標體系的少數幾個線性組合,並且這幾個線性組合所構成的綜合指標將盡可能多地保留原來指標變異方面的資訊。這些綜合指標就稱為主成分。要討論的問題是:(2)選擇幾個主成分。主成分分析的目的是簡化變數,一般情況下主成分的個數應該小於原始變數的個數。關於保留幾個主成分,應該權衡主成分個數和保留的資訊。(3)如何解釋主成分所包含的經濟意義。§2數學模型與幾何解釋假設我們所討論的實際問題中,有p個指標,我們把這p個指標看作p個隨機變數,記為X1,X2,…,Xp,主成分分析就是要把這p個指標的問題,轉變為討論p個指標的線性組合的問題,而這些新的指標F1,F2,…,Fk(k≤p),按照保留主要資訊量的原則充分反映原指標的資訊,並且相互獨立。這種由討論多個指標

文档评论(0)

子不语 + 关注
官方认证
服务提供商

平安喜乐网络服务,专业制作各类课件,总结,范文等文档,在能力范围内尽量做到有求必应,感谢

认证主体菏泽喜乐网络科技有限公司
IP属地山东
统一社会信用代码/组织机构代码
91371726MA7HJ4DL48

1亿VIP精品文档

相关文档