- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相關係數
社會統計(上) 二元隨機變數(Bivariate Random Variables) 社會中大多數的事件是同時發生或互相關連的: 如教育程度與薪資 人口密度與犯罪率 市場中廠商的數目與商品價格 二元隨機變數描述兩個隨機變數X與Y共同發生的的數值組合(X,Y),其發生的機率可用聯合機率函數來表達 Joint Probability Tables聯合機率表 聯合機率函數 設X,Y為二元間斷隨機變數,X之值為x1,x2,x3,…xn,Y之值為y1,y2,y3…ym,若f(xi, yj)滿足下列兩條件: 邊際機率函數 設X,Y為二元間斷隨機變數,其機率函數為f(x,y),則X, Y的邊際機率函數分別為fx(xi)與fy(yj) X,Y的聯合機率分配表 條件機率 設f(x,y)為二元機率函數,則 在Y= yj的條件下,xi發生的條件機率為: 兩變數獨立 兩變數彼此沒有關連,稱為獨立(independent): 設X,Y為二元隨機變數,若X,Y滿足下列任一條件,則X,Y為獨立: Covariance, 共變量 當X, Y兩隨機變數不互為獨立時,表示兩者間有關連。其關連的形式有很多種,最常見的關連為線性的共變關係。 兩個隨機變數X,Y間的線性關係可用兩個統計量來測量(1) 共變數(covariance) (2) 相關係數 (correlation coefficient)。兩者都能衡量兩變數之間是否有線性關係存在。 Stochastic Relationships and Scatter Diagrams Scatter Plot可以顯示兩連續變數x, y之間的關聯形式與強度: Covariance, 共變量 我們用簡單圖形可以來瞭解兩變數x與y之間的關係。另一種分析兩變數關係的統計技術為相關分析(correlation analysis)。 兩個隨機變數之間的共變關係為何? Covariance, 共變量 假設兩隨機變數Y與X之間具有某種關聯,母體X的平均值為ux、母體變異數σx2,母體Y的平均值為uy 、母體變異數σy2, Covariance, 共變量 測量兩變數之間是否有關連的一個有效指標為共變數(covariance) Covariance, 共變量 先生的收入(x)與太太的收入(y)關係如下表,請計算共變量(covariance) Covariance, 共變量 Covariance, 共變量 例題 Covariance, 共變量 證明: Covariance, 共變量 證明:if X, Y are independent, The Population Correlation Coefficient, ρ母體相關係數 用共變量來衡量兩變數的關係有一個缺點,即σxy及sxy的值會受到x與y衡量單位的影響。 The Population Correlation Coefficient, ρ母體相關係數 The Population Correlation Coefficient, ρ母體相關係數 因此,我們將covariance分別除上x與y的標準差σx、σy,得到標準化後的指標稱之為相關係數: Sample Correlation Coefficient, r樣本相關係數 樣本相關係數: 相關係數的特性 相關係數衡量兩變數之間是否有線性關係,相關係數愈大,代表兩變數之間的線性關係愈強。相關係數為零,代表兩變數沒有線性關係。 相關係數的值介於正負1之間,正1代表兩者呈完全正相關,負1代表兩者呈現完全負相關。 如果x與y為獨立,則相關係數ρ=0。 如果ρ=0,x與y不一定為獨立,因為他們可能具有非線性關係。 相關係數的特性 證明:若x為y之線性函數y=a+bx,則x與y的相關係數為±1。 相關係數的強弱 r = ? 1 為完全相關 r = 0 為無相關 例題 例題 母體相關係數的檢定 樣本相關係數r為母體相關係數?的估計式。 母體相關係數的檢定 利用檢定斜率的公式: 例題 續上例 相關係數與因果關係 相關僅代表兩變數間有線性關係,不必然隱含因果關係,下列情況皆有可能 相關係數與因果關係 商品的價格愈高,需求愈低? 美國職業運動的票價每年都在增長,但需求不減反增。 相關分析僅考慮兩個變數x, y 之間的關係,而忽略其他可能影響y的因素。 人口增加、收入增加、職業運動受歡迎的程度增加等 相關係數不受單位尺度變換的影響 例題 某校MBA畢業生的在學成績(x)與工作起薪(y)的資訊如下: 例題 X Y (a) r = 0.8 X Y (b) r = .95 X Y (c) r = 0 X Y (a) r = 0 X Y (d) r = -.90 X Y (c) r = -0.5 求x與y的correlation?
您可能关注的文档
- 生物体的基本构造与功能-Tpedutw.PDF
- 生物多样性指标评价表更正二版2002版.DOC
- 生物多样性教学综合活动领域活动设计-Tpedutw.DOC
- 生物多样性数据分析和生物统计培训班-中国生态系统研究网络.DOC
- 生物多样性对生态系统功能及其稳定性的影响-中国生态农业学报.PDF
- 生物多样性相关法规.PDF
- 生物多样性漫谈.PDF
- 生物多样性和植物分类及命名-植物生物学精品课程.PPT
- 生物圈是人类和其他生物共同生活的唯一家园.PPT
- 生物大分子相互作用检测技术新进展-生物化学与生物物理进展.PDF
- 《GB/T 4340.2-2025金属材料 维氏硬度试验 第2部分:硬度计的检验与校准》.pdf
- GB/T 4340.2-2025金属材料 维氏硬度试验 第2部分:硬度计的检验与校准.pdf
- 中国国家标准 GB/T 4340.3-2025金属材料 维氏硬度试验 第3部分:标准硬度块的标定.pdf
- 《GB/T 4340.3-2025金属材料 维氏硬度试验 第3部分:标准硬度块的标定》.pdf
- GB/T 4340.3-2025金属材料 维氏硬度试验 第3部分:标准硬度块的标定.pdf
- 《GB/T 45284.1-2025信息技术 可扩展的生物特征识别数据交换格式 第1部分:框架》.pdf
- 中国国家标准 GB/T 45284.1-2025信息技术 可扩展的生物特征识别数据交换格式 第1部分:框架.pdf
- GB/T 45284.1-2025信息技术 可扩展的生物特征识别数据交换格式 第1部分:框架.pdf
- 《GB/T 45284.5-2025信息技术 可扩展的生物特征识别数据交换格式 第5部分:人脸图像数据》.pdf
- 中国国家标准 GB/T 45284.5-2025信息技术 可扩展的生物特征识别数据交换格式 第5部分:人脸图像数据.pdf
文档评论(0)