多变量期末总整理
多變量期末總整理
主成份分析(PCA)
對於某一問題同時可以考慮好幾個因素時,我們並不對這些因素個別處理,而是將它們總和起來處理,這就是PCA。
實際上主成份分析之主要目的乃是希望用較少的變數去解釋原來資料中的大部分變異,亦即期望能將我們手中許多相關性很高的變數轉化成彼此互相獨立的變數,能由其中選取較原始變數個數少,能解釋大部分資料之變異的幾個新變數,也就是所謂的主成份,而這幾個主成份也就成為我們用來解釋資料的總和性指標。
而為什麼要用解釋變異之能力來尋找主成份呢?舉上例而言,考試的目的是希望能評估出學生的學習成效及能力程度如何,當我們只要看學生的數學程度如何時,當然可藉由一份良好的試卷來測驗出學生的程度分布狀況,可是怎樣才是一份良好的試卷呢?當然是程度好的學生所考的成績較高,而程度差的學生成績就較低,亦即能真正反映出學生程度差異的真實分布狀況。就統計上而言,即是此份考卷的分數能產生愈大的變異數,愈能夠反映學生彼此程度之差異,而在上例中,我們不想個別處理四科成績所反映的各科能力狀況,卻想做一個總體性學習狀況比較時,便要用所謂的PCA來找出主成份,主成份即由原來四科成績的線性組合而成的新變數,亦即一個可以幫助我們看出學生們在此四科之學習狀況的總和性指標,在此情況下,我們當然也希望此指標亦能真正顯出學生程度之差異,所以此指標能產生愈大的變異數,代表對學生之程度差異擁有愈大的反映及解釋能
原创力文档

文档评论(0)