简单相关分析 教程.ppt

學習目標

本章架構

14.1.1共變異數的意義14.1.2相關係數的意義14.1.3相關係數的估計14.1.4相關係數的檢定

相關分析(correlationanalysis)探討數值變數間線性關係的程度與方向的方法,共變異數(covariance)與相關係數是用來瞭解兩變數間線性關係的工具。如果變數間無法區分出所謂的依變數(dependentvariable)與自變數(或獨立變數)(independentvariable)時,則使用相關分析來探討變數間的線性關係;如果變數是可以區分的話,則使用線性迴歸分析來探討變數間的線性關係。

14.1.1共變異數的意義共變異數(covariance)測量兩個數值變數間的線性關係。線性關係當一個變數變動時,另一變數則呈同方向或相反方向變動。

共變異數的意義(續)母體共變異數其中N代表母體總數。樣本共變異數其中n代表樣本數。

共變異數的意義(續1)共變異數的性質共變異數的值介於-?到?之間。X與Y的共變異數大於零,表示X與Y同方向變動。X與Y的共變異數小於零,表示X與Y反方向變動。X與Y的共變異數等於零,表示兩變數間沒有「線性」關係,但並不表示兩者之間沒有其他關係存在。

共變異數的意義(續3)當兩變數與的共變異數大於零時,可以看出與大局部落於第一與第三象限,也就是兩者移動的方向是一致的,亦即正的線性關係。(如圖14.1之左上圖)當兩變數與的共變異數小於零時,可以看出與大局部落於第二與第四象限,也就是兩者移動的方向是相反的,亦即負的線性關係。(如圖14.1之右上圖)當兩變數與的共變異數等於零時,可以看出與均勻落於所有四個象限,而看不出兩者間線性移動的關係,但卻可能存在其他非線性關係。(如圖14.1之下方二圖)

共變異數的意義(續2)圖14.1:不同共變異數值情況下X與Y的散佈圖

例14.1停留時間與消費額的關係某遊樂區經理想了解遊客停留時間與消費額的關係,於是蒐集了10位遊客的資料如表14.1表14.110位遊客的停留時間與消費額

續例14.1由表14.1可知

14.1.2相關係數的意義相關係數〔correlationcoefficient)乃是指皮爾生相關係數〔Pearsoncorrelationcoefficient),其用途在於測量兩個數值變數間的線性關係。當兩變數有相關存在,並不代表兩者一定存在因果關係,但是當相關程度高的時候,彼此的預測能力也高。

計算至2003/3/24資料來源:Bloomberg整理:怡富投顧

相關係數應用實例二我國在漸邁入高齡化社會的同時,整體社會每年平均花在醫療保健上的費用,將益為提高。由此可看出:年齡是影響個人每年花在醫療保健費用多寡的原因之一。

個人每年花在醫療保健費用和個人總財富累積這兩個因素,同時受年齡的影響,才使得醫療保健費用和個人總財富累積兩個變數間間接地具高度線性相關,而其實醫療保健費用和個人總財富累積兩個變數間並不具有因果關係。但是,如果醫療保健費用和總財富累積兩個變數,都去除掉年齡的影響後,將發現這兩個因素呈低度線性相關。也就是說,去除掉年齡的影響後,醫療保健費用和總財富累積的偏相關係數變得很接近0。“只要常看病,口袋裏的孫中山就會愈多〞的奇怪推論,在去除幕後的藏鏡人—年齡之後,自可迎刃而解。(資料來源︰易得太資訊(統計桃花源))

14.1.2相關係數的意義(續)母體相關係數其中μX,σX為隨機變數X的平均數與標準差;μY,σY為隨機變數Y的平均數與標準差;σXY為隨機變數X與Y之共變異數。

14.1.2相關係數的意義(續1)假设X與Y為成對資料則母體相關係數可表為

14.1.2相關係數的意義(續2)相關係數的性質:相關係數的值介於–1與1之間。當ρXY=1,表示X與Y為完全正相關,亦即當X變動時,Y亦以相同方向變動;反之,亦然。當ρXY=–1,表示X與Y為完全負相關,亦即當X變動時,Y亦以相反方向來變動;反之,亦然。當ρXY=0,代表X與Y完全沒有線性關係,不過並不代表兩者之間沒有其他型態關係(如拋物線關係)存在。

14.1.3相關係數的估計我們必須假設之母體為一二維常態分配(Bivariatenormaldistribution),然後抽出樣本資料,來計算樣本相關係數,而其定義如下:其中

例14.2續例14.1假设試問停留時間與消費額之相關係數為何,可利用Exc

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档