- 8
- 0
- 约5.26千字
- 约 77页
- 2018-03-02 发布于广东
- 举报
回归与相关分析 linear regression 在医学科学研究中常遇见如下问题: 年龄与血压 身高与体重 药物剂量与动物死亡率 环境介质中污染物浓度与污染源的距离 这些变量间的关系具有随机性的一种“趋势”,即:自变量x在一定的范围内取不同的值,因变量y随x的变化呈现一定的趋势 常用回归与相关分析 例11.1 在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液临床上有时又不容易采集到。某医生欲用容易测定的血清IL-6含量,来了解急性脑血管病病人脑脊液IL-6水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6(pg/ml)和脑脊液IL-6(pg/ml)数据见表11.1,试求脑脊液IL-6对血清IL-6的直线回归方程。 一:直线回归与相关的定义 统计学上将分析某变量随另一变量变化依存关系的方法称为直线回归,它通过拟合线性方程来描述两变量间的回归关系。 直线回归方程 直线回归参数的含义 :回归直线在轴上的截距(intercept)。 0,表示直线与纵轴的交点在原点的上方; 0,则交点在原点的下方; =0,则回归直线通过原点; :回归系数(regression coefficient),即直线的斜率(slope)。 0,表示 随 增大而增大; 0,表示 随 增大而减小; =0,表示直线与轴平行,即 与 无直线关系。 回归系数b的统计学意义: 自变量x改变一个单位时,应变量y平均变化个b单位。 二、直线回归方程的建立 残差:由回归方程 知,当自变量取 某值x时,因变量为 ,而实际观察值却时y,两者 之差为残差(residual),即 二、直线回归方程的建立 根据数学上的最小二乘法原理,使直线上各估计值 与实测值 Y 之差的平方和 最小 , 可推导 和b 的计算。 直线回归分析的具体步骤 按实测值绘制散点图,可见有线性趋势。 求回归参数 和b。 列出直线回归方程。 回归系数的假设检验。 由例11.1 1 、 原始数据散点图初步分析,本资料散点有线性趋势,故可进行线性回归分析。 2、 三、直线回归的统计推断 无论y对x的回归是否为线性函数,总可拟合得线性方程 ,但这些方程并不一定都有意义,所以需要对方程及其参数进行估计与假设检验。 1、总体回归系数的估计与假设检验 回归系数的区间估计 总体回归系数的(1- )可信区间 回归系数的假设检验 目的:推断总体回归系数 ? 是否为0, 确定所求得的回归方程是否成 立。 即使为样本回归系数 零,由于抽样误差,其总体回归 系数β也不一定为零;因此需作β是否为零的假设检验。 假设检验采用 方差分析 t检验。 t 检验 基本思想与样本均数与总体均数的比较相似。 检验统计量 t 的计算 例11.2 方差分析 基本思想:变异的分解 即将总变异分解为两个部分: 变异的分解 P点的纵坐标被回归直线与均数截成三个线段: 第一段( ),表示p点与回归直线的纵向距离,即实际值Y与估计值 之差,称为剩余或残差。 第二段( ),即估计值 与均数 之差,它与回归系数的大小有关。 第三段 ,是应变量的均数。 的分解 上述三段的代数和为: 移项: 将等式两端平方后再求和: 即将总变异分解为两个部分: 即 , 的离均差平方和,说明未考虑与的回归关系时的变异。 即 ,回归平方和,反映在的总变异中由于 与 的直线关系而使变异减小的部分也就是在总平方和中可以用x解释的部分, 越大,说明回归效果越好。 即 ,残差平方和,它反应除线性影响之外的一切因素作用,也就是在总平方和中无法用解释的部分。
原创力文档

文档评论(0)