08-Ch7回归与相关.ppt

08-Ch7回归与相关

第12-13章 相关与回归 变量间关系 血压 ~ 年龄 动物死亡率 ~ 毒物剂量 体重~身高 肺活量~体重 相关: 血压和年龄关联的程度如何? 动物死亡率与毒物剂量关联的程度如何? 回归: 人群中,平均而言, 血压 如何随年龄变化? 毒性实验中, 动物死亡率如何随剂量变化? 线性相关 相关系数(Correlation Coefficient) 1.总体相关系数(Population correlation coefficient) Pearson’s 乘积-矩线性相关系数: “两个标准化变量之乘积” 的总体平均 ---- 简单相关系数(simple correlation coefficient) r 随样本变化而变化, 是一个随机变量 ? 总体的回归系数 r → ? 问题 : ? =0 吗? 假定: X 和Y 服从二元正态分布 H0: ρ=0, H1: ρ≠0 α=0.05 (1) 查表 (附表16 ) ----拒绝H0, 父亲身高和儿子身高之间具有线性相关性 问题: 因为 , 非常小, 我们可以说 ‘相关性非常强’吗 ? 小的 P 值是否意味着相关系数非常大? (2) t 检验 (假设二元正态分布) H0: ρ=0, H1: ρ≠0 若 Pα, 则拒绝 H0 …… ? =20-2=18, 适用于: 有序变量(秩次数据) 也适用于: 连续型变量(测量数据) ---- 不服从正态分布; 或 不知道什麽分布; 或 测量不精确 或 X 和Y 之一是有序变量 (2) t 检验 和 Pearson’s 相关系数的检验相同. 若 p 较小,则拒绝 1. 非随机样本莫谈相关 有时,自变量的数值不是随机的,而由研究着选定 例如, 探索剂量-反应关系( dose –response relationship) 化学实验室中探索产量与反应温度关系 这时尽管可以计算,但结果并不代表相关系数. 2 . 不要盲目合并资料 3. 样本相关系数的解释 真实的故事 儿子的身高与小树的高度 一周岁时计算相关系数 结论: 小树使孩子迅速成长, 或 孩子使小树迅速成长?! 4. 不要把任何两个变量放在做相关或回归 – 必须在专业上有意义. 简单相关 包括 直接关联 和 间接关联 Example 1 计算儿子身高Y 关于父亲身高X的回归方程 线性回归三步骤 (i)已知:n对观察值(X1,Y1),(X2,Y2),…,(Xn,Yn); (ii)作散点图(scatter diagram) (iii)若散点图呈直线趋势,则配一条直线: 求出直线的方程式 什麽是回归? 线性回归的任务 估计 ? 和 ?, 得到 其中, a – 估计 ? , 截距 b --估计? , 斜率 -- 估计 ?y|x 最小二乘原则: 观测点与所配直线纵向距离的平方和最小 回归系数及其计算 找一条直线使残差平方和最小 利用微积分知识,容易得到

文档评论(0)

1亿VIP精品文档

相关文档