- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2019. 2 月
空間迴歸模型中隨機效應與解釋變數存在相關性時
迴歸係數估計的探討
國立彰化師範大學數學系暨統計資訊研究所
邱詠惠 、陳春樹
空間迴歸模型應用甚廣,舉凡具空間位置相關的資料皆可使用它來做分析,
例如 :空氣中PM2.5的濃度 預測 、各縣市登革熱患病人數的探討 、模糊影像資料
的重建 …等。由於資料在空間上的分布隱含 不可觀測的相關性結構 ,因此空間迴
歸模型 相較於一般的線性迴歸模型 多考慮了資料彼此間的空間相關性 於模型中,
即所謂的 空間隨機效應項 (spatial random effect ) ,因此也增添空間迴歸模型的應
用廣度 隨著。 資料型態的複雜與 多樣性,空間隨機效應項的 分布設 定也有所不同,
但 大體上皆以距離相 近的觀測值 相較於距離較遠的觀測值 有較強的相關性為主
要核心思想 。以地震為例,與震央較近的地方其芮氏規模震度較大,隨著距離震
央的距離越遠則震度規模會有遞減的趨勢,亦即相關性越小 。在實務的應用層面 ,
Matérn相關性函數(Matérn correlation function) (Matérn 2013)常使用於描述空間
隨機效應項的 空間相關結構,函數中的 ν 與 φ 分別為平滑參數與尺度參數,(ν ,
φ的值) 越大表示背後的相關性結構越強 ,此函數亦反應距離 相近的觀測值具有
較強的相關性 圖一( ) ,隨著觀測值 之間的距離越遠, 其相關性有遞減的趨勢 。
| |
圖一 :在不同參數值(ν ,φ)之下,距離為 − 時的 Matérn相關性函數值 。
圖中函數值 越大(紅色) ,代表資料空間相關性越強。
- 1 -
2019. 2 月
使用迴歸模型 分析資料 主要是想了解感興趣的解釋變數 與反應變數之間的
關係, 進一步也可以 針對未抽樣的位置進行預測,使得研究者能依據建模與分析
結果執行相對應的因應措施或擬定改善計畫 。然而如Zadnik 與Reich (2006)的
文章所提及,斯洛維尼亞國家 (Slovenia的人民之胃癌) 標準化發生比 (SIR)與社
會經濟地位 (SEc)應呈現負相關的趨勢 (如圖二所示 ) ,同時透過線性迴歸模型的
配適結果亦得到顯著的負值迴歸係數 (亦即SIR 與SEc呈現顯著負相關 )。但是透
過空間迴歸模型並藉由貝氏方法估計模型參數所得到的社會經濟地位之迴歸係
數估計值為 −0.02 ,且在 95%的信心水準下可得此係數的可信區間為 (−0.10,
0.06) 。此結果表示此迴歸係數估計值−0.02 並不顯著 ,甚至有可能為正值 ,這
似乎 與實務上的認知違背且可能讓研究者做出錯誤的推論 。
圖 二: 斯洛維尼亞國家每個城市的胃癌標準化發生比 (SIR)與社會經濟地位(SEc)分布圖。
此圖摘錄自Reich et al. (2006) 。
此現象的發生可能是因為社會經濟地位觀測值是隨著 此國家的城市地理位
置而收集 ,背後可能存在某種未知的空間相關性結構,此時可能與空間迴歸模型
中的隨機效應項產生共線性 ,在空間統計中亦稱之為空間混淆效應 (Spatial
confounding effect) ,此現象將導致不準確的迴歸係數估計量 (e.g., Page et al.
2017) 。實務上若假設觀測值間彼此相互獨立,線性迴歸模型之迴歸係數可藉由
最小平方法 (LS)得之 ,然而存在隨機效應項的空間迴歸模型則因觀測值間非獨
立,此時迴歸係數的估計值可使用加權最小平方法 (WLS )得之 。但是當空間混淆
效應存在時,直接使用最小平方法或加權最小平方法估計迴歸係數均會產生偏誤
的估計結果(Page et al. 201
文档评论(0)