数理统计15相关与回归.pptVIP

  • 15
  • 0
  • 约7.49千字
  • 约 52页
  • 2018-05-04 发布于四川
  • 举报
变量之间的关系: 血药浓度与时间、年龄与 血压、维生素片的含量与贮存期等。 函数关系:确定关系。例如圆的面积 S=? r2 时间与体温. 相关关系(correlation):非确定。例如人的 年龄与血压, 身高与体重. 回归分析(regression analysis):研究具有相关 关系的变量之间的数量关系式的统计方法。 回归(regression) 第一节 相关分析 一、散点图 设对两个随机变量 X 和 Y 进行观测,得到 一组数据 现以直角坐标系的横轴代表变量 X,纵轴代表变量 Y,将这些数据作为点的坐标描绘在直角坐标系中,所得的图称为散点图 (scatter diagram)。 二、相关关系与样本相关系数 (一)相关关系 (correlation) 两个随机变量,如果对其中任一个随机变量的每一个可能取的值,另一个随机变量都有确定的分布与之对应,并呈直线变化的趋势,则称这两个随机变量之间存在相关关系. 在统计中,用相关指标来表明相关变量之间的密切程度,其理论、计算和分析称为相关分析。 在相关分析中,用来度量随机变量 X 与 Y 之间线性相关关系密切程度的统计指标是相关系数(correlation coefficient)。 总体相关系数 其中 是随机变量 X 和 Y 的协方差。 总体的相关系数 ? 是反映两个变量之间线性 相关程度的一种统计参数(数字),它不受 X、Y 量纲的影响,表现为一个常数,其取值 介于 -1 和 1 之间,即 -1 ≤? ≤1。 (1)当 ? ? ?=1时,称 X 与Y 完全相关(即 呈线性函数关系) (2)当 ? =1 时,称 X 与 Y 完全正相关 (3)当 ? =-1 时,称 X 与 Y 完全负相关 (4)当 ? =0 时,称 X 与 Y 不相关 (non- correlation), 即 X 与 Y 不存在线性关系 (5)当 ? >0时,称 X 与 Y 正相关 (positive correlation) (6)当 ? <0时,称 X 与 Y 负相关(negative correlation) (二)样本相关系数 定义9-1 对变量 ( X, Y ) 的一组样本观测数据 ,称 (9-2) 为样本相关系数 (sample correlation coefficient) 或 Pearson 相关系数 其中 样本相关系数没有单位,其取值为 -1≤r≤1 (1)?r?=1,散点图中所有对应的点在同一条 直线上, X 与 Y 实际上是一种线性函数关系. (2)0? ?r??1,X 与 Y 间存在一定的线性相关关系。 ?r? 的值越大,越接近于1,X 与 Y 之间线性相关程度就越高;反之, ?r? 的值越小,越接近于0,X 与Y 之间线性相关程度就越低。 (3)r =0, X 与 Y 之间不存在线性相关关系。 (三)相关系数的显著性检验 检验步骤: 1)建立原假设 H0: ? =0 (X 与 Y 不相关); H1 : ?≠0 2)计算样本相关系数 r 的值; 3)对给定的显著水平 ? ,自由度为 n-2,由 相关系数检验表(表16)得临界值 r?/2(n-2); 4)统计判断:当 ?r?≥ r?/2,则 P<?,拒绝H0, 即认为变量 X 与 Y 间的相关性显著; 当 ?r?< r?/2,则 P ?,接受 H0 ,即认为变 量 X 与 Y 间的相关性不显著。 例9-1 在开发一种抗过敏新药时,要对不同剂量的药效进行检验。10 名患者各服用了该新药一个特定的剂量,药物作用消失时立即记录。试验数据列于表 9-1 中,X 是剂量 Y 是症状持续消除的日数,用 7 个不同的剂量,其中 3 个剂量重复给两名患者。 (1)画出剂量

文档评论(0)

1亿VIP精品文档

相关文档