相關與迴歸的迷思.ppt

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相關與迴歸的迷思.ppt

2.4 相關與迴歸應注意事項 相關性與迴歸直線的侷限 相關性與迴歸直線僅用來描述兩變數之間的線性關係,且其數值受特殊點的影響極大。 外插(Extrapolation)預測 以迴歸直線預測原解釋變數概括的範圍外之資料 x 所對應之 y 值,其準確性多半不高。 以3~8歲孩童身高資料得到的迴歸直線,預測25歲成人身高(預測值約為8呎長人)必然不準確。 使用平均數 使用平均數資料(月平均瓦斯消耗量)評估相關性,往往高於未平均前資料(每日瓦斯消耗量)的相關性。 平均數資料已整合了未平均前資料的離散情況。 Correlations based on averages are usually too high when applied to individuals. It is important to note exactly what variables were measured in s statistical study. 迴歸直線與原始資料 隱藏變數的影響 隱藏變數(lurking variable):對有興趣的兩變數具有重要的影響,但並未被包括在研究範圍的變數。 研究英國哈爾(Hull)市各地區房舍狀況,發現資料顯示各地區擁塞程度(x)與沒有洗手間的房舍比例(y)之相關係數低(0.08)。(Expect high correlation) 依地區內public housing比例的高低將地區分成兩群後,發現在各群內之相關係數極高(分別為0.85及0.91)。 地區房舍狀況研究 r = 0.08 地區房舍狀況研究 有關聯未必有因果關係 (Association Does Not Imply Causation) 兩變數關聯強度高,未必表示“改變解釋變數的值,反應變數的值必然跟著改變”。 各國每人電視機數目與平均生活水準呈高度正相關,即電視機數目多則平均生活水準高。但送大量的電視機到盧安達未必能改善其人民生活水準。 電視機較多的國家通常較富裕,有較好的營養、用水和醫療等生活水準也較高。 因果關係的探討 在隱藏變數控制之下,以實驗來探討解釋變數與反應變數的因果關係。 無法實驗的情況,如吸菸是否引起肺癌、二手菸是否引起肺癌、住變電所附近是否易引起血癌等,則須更多的研究證據來確認因果關係。 香菸的故事 吸菸與肺癌之關係的研究,無法進行人體實驗,故使用多種方法來確立其因果關係。 相關分析:吸菸與肺癌相關性很高。 研究一致性:在許多國家對不同的人所做的研究,都呈現吸菸與肺癌相關性很高。 較高劑量和較強反應的關聯: 每天吸菸較多或吸菸歷史較久者更常得肺癌,戒菸者風險降低。 香菸的故事(續) 被懷疑的原因(cause)在時間上超前結果(effect): 死於肺癌的男性人數在吸菸人口普遍後上升,時間的差距約30年。死於女性肺癌患者的人數也隨著吸菸人口的增加而後增加,時間的差距也是30年。 動物實驗的結果顯示,吸菸產生的焦油的確會致癌。 The evidence for causation is overwhelming—but it is not as strong as the evidence provided by well-designed experiments. * * r = 0.85 r = 0.91

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档