- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相關分析Correlation Analysis 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 2006年4月29日 一個例子 很多時候,我們想要知道一件事物與另一件事物之間的關係(relationship) 而且希望能有個關係指標(index of relationship)來說明關係強度,指標小關係強度低,指標大關係強度高;換句話說,需要有個「相關係數」(coefficient of correlation) 例如:有一盒玩具兵,我們對玩具兵的身高、體重有興趣,想像所有的玩具兵都是同樣的身形(shape),那麼身高不同體重也就不同 看看這五個玩具兵,您會怎麼描述他們的身高和體重的關係? 我們可以給個 .00到1.00之間的數值來描述其關係強度(strength),同時說明關係的方向(direction) coefficient of correlation的種類 The rank-difference coefficient (?) 等級相關 易理解 排序資料 Spearman rank-difference coefficient of correlation The product-moment coefficient (r) 常用 連續資料 Pearson product-moment coefficient The rank-difference coefficient 將5個玩具兵的身高和體重加以排序 將相同序位以線段相連,線段形成階梯狀 計算每個玩具兵的身高和體重的排序差異(rank difference),請注意,所有的rank difference都是零 計算rank-difference coefficient,以?(rho)表示 負相關 如果換成真人的話,可能就不一定能和玩具兵一樣都有相同的身形,可能矮胖、高瘦 The product-moment coefficient (r) product-moment的意思 其實通常我們不會計算排序差異,而是計算真實的身高和體重,如下表 相關分析 當變項為一個連續變數時,可以次數分配和圖示來呈現資料的內容與特性,或者以平均數和標準差來描繪資料的集中和離散情形。 當兩個變數皆為連續變數時,則需利用相關(correlation)或迴歸(regression)來分析兩變數的關聯程度,又稱為共變(covariance)關係。 線性關性 兩個連續變數的共變關係,可能有很多種形式,其中最簡單也是最常見的關聯型態是線性關係(linear relationship)。 兩個變項的關聯關係可以以一條最具有代表性的直線來表示 例如:身高與體重,身高越高,體重也越重 Y=bx+a x為身高,y為體重 b為斜率,x每變動一個單位, y的變動量 身高每增加一公分,體重增加量 當b斜率為正值時,表示兩個變項是正相關 當b斜率為負值時,表示兩個變項是負相關 相關係數 兩個連續變項的關聯情形可以散布圖來呈現 精確的相關分析所產生的是一個相關係數(correlation coefficient),相關係數是介於-1與+1之間的數。 若為+1 ,則表示兩變數具有完全的正線性相關 若為-1,則表示兩變數具有完全的負線性相關 若相關係數趨近於0,則表示兩變數沒有線性相關 此一係數最早由Pearson所提出,又稱為皮氏積差相關係數。 Pearson相關係數 相關係數值的大小,可以反應兩個變項關聯性的強弱,但是相關係數是否具有統計上的意義,必須透過統計檢定來判斷。 由樣本計算兩變項之相關係數Pearson’s r,若要推論到母群? ,必須經由統計檢定由考驗其統計意義 虛無假設H0:兩變項X與Y不相關 (相關係數為0, ? =0) 對立假設H1:兩變項X與Y相關 (相關係數不為0, ? ?0) 當雙尾的機率p小於設定的顯著水準?(如0.05或0.01)時,則否定虛無假設,即相關係數不為零(兩變項相關) 以籃球得分為例。一個籃球隊獲勝場次與每場的平均得分有關連嗎? 從散佈圖中可看出,它們具有線性關聯。我們再從 1994、1995 NBA 球季分析資料得知,Pearson 的相關係數 (0.581) 在 0.01 水準時是有意義的。於是可能猜想,每季所贏得的場次愈多,則對手的得分愈少。這些變數為負相關 (0.401),而相關在 0.05 水準時最顯著。 相關分析 程序1 統計圖?散佈圖 X軸放自變項;Y軸放依變項 例:X軸為教育程度,Y軸為目前薪資(dataset: employee) 由散佈圖可以很明顯地看出兩變數之相關程度。再由相關程序求出兩變數之相關
您可能关注的文档
最近下载
- 2025至2030中国塑胶地板行业深度调研及前景趋势与投资发展报告.docx VIP
- 青鸟消防JBF-21SF-C系列主机说明书.pdf
- HT200电气原理图设计1.doc VIP
- Q/GDW+13053.25—2018++35-750并联电容器成套采购标准(第25部分:110(66)kV变电站10kV-6000kvar-12%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
- Q/GDW+13053.27—2018++35-750并联电容器成套采购标准(第27部分:220kV变电站10kV-8000kvar-12%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
- Q/GDW+13053.37—2018++35-750并联电容器成套采购标准(第37部分:330kV变电站35kV-40Mvar-12%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
- Q/GDW+13053.38—2018++35-750并联电容器成套采购标准(第38部分:500kV变电站35kV-60Mvar-5%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
- 柴油机发电机调试记录表格.docx VIP
- Q/GDW+13053.39—2018++35-750并联电容器成套采购标准(第39部分:500kV变电站35kV-60Mvar-12%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
- Q/GDW+13053.41—2018++35-750并联电容器成套采购标准(第41部分:220kV变电站66kV-10Mvar-12%电抗率框架式并联电容器成套装置专用技术规范).pdf VIP
文档评论(0)