冠心病与年龄.docVIP

  • 607
  • 0
  • 约5.98千字
  • 约 9页
  • 2017-01-06 发布于江西
  • 举报
10.6 冠心病与年龄 问题 冠心病(Coronary Heart Disease,简称CHD)是一种常见的心脏疾病,严重地危害着人类的健康。到目前为止,其病因尚未完全研究清楚,医学界普遍认同的、重要的易患因素是 、高血脂、高血压、糖尿病、动脉粥样硬化及家族史等。多项研究表明,冠心病发病率随着年龄的增加而上升,在冠心病的流行病学研究中,年龄也是最常见的混杂因素之一。 为了更好的说明冠心病发病率与年龄的关系,医学家们对100名不同年龄的人进行观察,表1中给出了这100名被观察者的年龄及他们是否患冠心病的数据(其中冠心病一栏中,1代表被观察者患冠心病,0代表不患冠心病)。本节的目的是根据这些数据建立数学模型,来分析冠心病发病率与年龄的关系,并进行统计预测。 表1 100名被观察者的年龄与是否患冠心病的观察数据 序号 年龄 冠心病 序号 年龄 冠心病 序号 年龄 冠心病 序号 年龄 冠心病 1 20 0 26 35 0 51 44 1 76 55 1 2 23 0 27 35 0 52 44 1 77 56 1 3 24 0 28 36 0 53 45 0 78 56 1 4 25 0 29 36 1 54 45 1 79 56 1 5 25 1 30 36 0 55 46 0 80 57 0 6 26 0 31 37 0 56 46 1 81 57 0 7 26 0 32 37 1 57 47 0 82 57 1 8 28 0 33 37 0 58 47 0 83 57 1 9 28 0 34 38 0 59 47 1 84 57 1 10 29 0 35 38 0 60 48 0 85 57 1 11 30 0 36 39 0 61 48 1 86 58 0 12 30 0 37 39 1 62 48 1 87 58 1 13 30 0 38 40 0 63 49 0 88 58 1 14 30 0 39 40 1 64 49 0 89 59 1 15 30 0 40 41 0 65 49 1 90 59 1 16 30 1 41 41 0 66 50 0 91 60 0 17 32 0 42 42 0 67 50 1 92 60 1 18 32 0 43 42 0 68 51 0 93 61 1 19 33 0 44 42 0 69 52 0 94 62 1 20 33 0 45 42 1 70 52 1 95 62 1 21 34 0 46 43 0 71 53 1 96 63 1 22 34 0 47 43 0 72 53 1 97 64 0 23 34 1 48 43 1 73 54 1 98 64 1 24 34 0 49 44 0 74 55 0 99 65 1 25 34 0 50 44 0 75 55 1 100 69 1 分析与假设 假设这100名被观察者是独立选取的,记x为被观察者的年龄,Y为被观察者患冠心病的情况(Y=1表示患冠心病,Y=0表示未患冠心病),显然Y是一个0—1变量。利用表1的数据作出Y对x的散点图(见图1)。 从图1容易看出,直接对上述数据建立像前面几节那样的回归模型是行不通的,需要对数据进行预处理。 数据预处理的一种方法是将被观察者按年龄进行分组,并统计各年龄段中患冠心病的人数,及患病人数占该年龄段总人数的比例(以下简称患病比例)。为方便起见,我们将年龄分成8个年龄段,分段后的数据见表2。 表2 各年龄段的冠心病人数及比例 年龄段 年龄段中点 人数 患冠心病人数 患病比例 20~29 24.5 10 1 0.1 30~34 32 15 2 0.13 35~39 37 12 3 0.25 40~44 42 15 5 0.33 45~49 47 13 6 0.46 50~54 52 8 5 0.63 55~59 57 17 13 0.76 60~69 64.5 10 8 0.80 合计 100 43 0.43 为考察患病比例与年龄的关系,首先根据表2数据做出患病比例对各年龄段中点的散点图(见图2,为方便起见,散点的横坐标均简单地取各年龄段的中点)。 从图2可以看出,冠心病患病比例随年龄的增大而递增,大致是一条介于0与1之间的S型曲线,这条曲线应该怎样用回归方程来确定呢?表1和表2中的患病比例实际上就是年龄为x时(以下均取年龄段的中点)Y的平均值,用(条件)期望的符号记作 y = E(Y|x)

文档评论(0)

1亿VIP精品文档

相关文档