多变量分析讲义.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多变量分析讲义

多變量分析 謝 邦 昌?? 輔仁大學統計資訊學系教授 兼 進修成長學院 院長 Http://.tw? Http://www.CDMS.org.tw E-Mail: stat1001@.tw? statben.shia@ MSN Messenger: statben@ 多變量分析 大多數由實務上所蒐集到的資料都是多元的。 對於一般的問題,我們往往量了一大堆不同變量的數據。 所謂的一個p-維變量,就是對一個對象量測p個不相同的變數所得到的結果。如果p的值不算太小,比如說5以上,要分析這樣的數據,我們就需要用到多變量的技術了。 主成分分析(principal component analysis) 因子分析(factor analysis) 集群分析(cluster analysis) 判別分析(discriminant analysis) 典型相關分析(canonical correlation analysis) 第一類:如何降低問題中的維數 包括主成分分析和因素分析。 第二類:分類 包括了集群分析和判別分析兩種。 第三類:變數間相關性 典型相關分析 主成分分析(principal component analysis) 一般學校的科目有:國語,算術,自然,社會等。每個學生的成績是按各科成績分別加起來的。 依照各科考試的內容,各科目應當以加權比例來計算分數 這樣的「總平均」在某種程度上代表了一些「綜合」的意義。 是第i-個考生的成績,我們要用那一種「加權平均」,才能最有效地做出區分呢? 是p-維空間裡的一個單位向量(unit vector),它代表一種「方向」的概念,就是「主成分」(principal component)方向。 主成分分析的目的不止是找一個平均,而是想找一個最有鑑別力的平均。用數學的話來說,那就是找「使加權平均的變異數最大的方向」。 用數據的本身來尋找對全部變異最有影響力的方向,第二有影響力的方向,....等等 。 我們當然希望能夠找到一兩個方向能解釋大部分數據中的變異,因而得到「降低原始數據中的維數」的效果。這就是主成分分析(principal component analysis, PCA)。 主成分分析之主要目的 : 希望用較少的變數去解釋原來資料中的大部份變異。 更期望能將我們手中許多相關性很高的變數轉化成彼此互相獨立的變數。 能由其中選取較原始變數個數少,能解釋大部份資料中的變異的幾個新變數。 這幾個新變數(主成分)也就成為我們用來解釋資料的綜合性指標。 主成分分析模式: 因子分析(factor analysis) 『主成份分析』它的目的是希望用較少的變數去解釋原始資料的大部分變異。而這些變數也就是我們利用主成份分析法整理而得的總體性指標。 『因素分析法』也是希望能夠降低變數的數目,但不同的是我們是想在一群具有相關性且難以解釋的資料中, 找出幾個概念上有意羲的,並且彼此之間近於獨立的可以影響原始資料的共同因素。 以九個變數為例子,在九個變數中,可能某幾個變數在表面上看來即很相似,亦即其彼此間之相關係數較高。 而事實上會影響這些變數觀察值結果的很可能是其背後看不到的某些共同原因所造成的。因此我們知道,可藉著因素分析法,由九個彼此相關的變數中萃取出其背後真正影響結果的三個主要因素: (X1, X2, X3, X4, X5, X6, X7, X8, X9)→(F1, F2, F3) 主成份分析所著重的在於如何「轉換」原始變項使之成為一些綜合性的新指標,而其關鍵在「變異數」問題。與主成份分析不同的是,因素分析重視的是如何解釋變數之間的「共變異數」(covariance)問題 。 因素分析法之步驟如下: 1.選擇所欲分析的變數 2.準備相關矩陣,估計共同性 3.決定因素的數目 4.從相關矩陣中抽取共同因素 5.旋轉因素,增加變項與因素之間關係的解釋 6.結果解釋 決定因素的數目: 1.特徵值準則(Eigenvalue) 2.斜坡檢定準則(Screen test criterion) 3.事前準則(A prior criterion) 4.累積百分率法 5.解釋法則 集群分析(cluster analysis) 統計學家通常應用集群分析法來對資料做簡化的工作及分類,也就是把相似的個體(觀測物)歸於一群。 將一群具有相關性的資料加以有意義的分類 集群結果在同一群組內有相近性質,不同群集間差異性大 用來對資料作摘要,不是在找『自然」或是『真正』的集群 只能用數值變數,不能用分類變數 距離測量 判別分析(discriminant analysis) 所謂判別分析法是在已知

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档