(12.21)第十章 简单回归分析.pptVIP

  • 3
  • 0
  • 约3.37千字
  • 约 52页
  • 2021-08-19 发布于陕西
  • 举报
4. 求回归系数和截距a值: 5. 列出回归方程 病人序号 血清胆固醇 甘油三脂 1 3.89 1.71 2 3.41 1.01 3 5.70 0.97 4 6.84 1.78 5 2.93 1.25 6 3.98 0.70 7 4.23 1.33 8 4.43 0.72 9 2.58 0.34 10 4.40 1.24 11 3.77 1.00 12 3.42 0.79 13 2.93 0.83 14 5.18 1.11 15 4.56 0.81 16 4.60 0.85 17 3.58 0.83 18 3.57 0.84 19 3.49 0.73 20 3.63 1.27 21 3.89 0.78 表10-1 21例肝癌病人血清胆固醇与甘油三脂相关性研究 6. 绘制回归直线 在X取值范围内,取两 个相距较远的点, 如:X1=3.41 和X2=5.70 X1=3.41时 =0.3075+0.1698×3.41=0.8865 X2=5.70时 =0.3075+0.1698×5.70=1.2754 图10-2 肝癌病人血清胆固醇与甘油三酯关系散点图 (3.41,0.8865) (5.70,1.2754) 将这两点(3.41,0.8865)和(5.70,1.2754)连接起来,可得该回归方程的直线。 图10-2 肝癌病人血清胆固醇与甘油三酯关系散点图 五、回归系数的假设检验 (即对β进行统计推断) 建立回归方程后,只要b不等于0,就要考虑, b不等于0,是因为总体回归系数β不等于0?还是抽样误差造成的b不等于0?所以,应对总体回归系数β作是否为0进行假设检验。 检验方法有两种: 1、方差分析 2、t检验 方差分析与t检验的关系是: F= t2 即 图10-3 回归前后因变量Y的残差示意图 实测点P、回归直线及Y均值之间的关系: 图10-3 回归前后因变量Y的残差示意图 P点被回归线b和 分为三段: 第一段 : 表示P点与回归线的纵向距离, 即实测y与y估计值 之差, 也称为剩余误差或残差。 图10-3 回归前后因变量Y的残差示意图 P点被回归线b和 分为三段: 第二段 : 是估计值 与均数 之差,它 与b大小有关, 大, 亦 大,反之亦然。 当b=0时, 此时 P点被回归线b和 分为三段: 第三段 : 表示x 轴到 的纵向距离。 图10-3 回归前后因变量Y的残差示意图 三段代数和为: 图10-3 回归前后因变量Y的残差示意图 移项,得: 图10-3 回归前后因变量Y的残差示意图 这是其中的一个P点,若将多个点子都这样处理,并将上式两端平方后求和,则: SS总 = SS回 + SS剩 图10-3 回归前后因变量Y的残差示意图 * * * * * * * * * 第十章 简单线性回归 在医学研究中,经常需要研究两个变量之间的相互关系和相互依存关系,如血糖与胰岛素水平、年龄与血压等,把这种统计分析方法叫做双变量关系的统计。 回归 ---- 变量间在数量上的依存关系 相关 ---- 变量间在数量上的相互关系 第一节 线性回归 1.直线回归(linear regression) :当一变量随 另一变量有规律的依存变化时,此依存变化 的数量关系称为直线回归关系。 直线回归是回归分析中最基本、最简单的 一种,故又称为简单回归或简单线性回归。 一、基本概念 2.直线回归分析:根据实测值建立回归方程式 (在图上绘一条最接近各实测点的直线),描述这两个变量的数量变化关系的方法过程。 图10-1 1.I型回归: 一个变量为选定变量(可控变量),另一 个变量为随机变量。 2. II型回归:两个变量均为随机变量。 二、简单线性回归分析的类型 两种回归模型 图10-2 线性回归的两种模型 II型回归 I型回归 两型回归模型 三、直线回归分析的前提条件(LINE) 经典的线性回归假定: 1.线性(Linear): 对于X各个取值,相应Y的总体均数 在一条直线上,表示为 。 2.独立性(Independent) : 各次观测相互独立。 3.正态性(Normal) :每个X对应Y的总体为正态分布。 4.等方差

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档