- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于疾病研究问题的数学模型
摘 要
现在与50年前相比,生出一个活泼健康的孩子越来像一个复杂的系统工程,需要精心运作每一个细节,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。本模型就题目给出的鼻炎家族史、主(被)动吸烟等12个因素的相关数据,建立多分类条件Logistic回归分析数学模型,利用SPSS软件包拟合出Sig-显著性(P)的值,再利用逐步回归中的后退法,把所有的变量引入模型,然后逐次把Sig值最大并且Siga(a=0.05)的变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的Sig0.05为止。最后所剩Sig值0.05所对应的因素:鼻炎家族史,孕期用药,先兆早产,剖宫产和孕期营养即为诱发胎儿疾病的主要影响因素。
关键词:疾病 Logistic回归分析 SPSS软件包 Sig(P)值
逐步回归后退法
问题重述
世界卫生组织最近发布的资料显示,与50年前相比,人们的生殖能力明显降低了,生一个活泼健康的孩子,越来越像一个复杂的系统工程,需要精心运作每一个细节,不敢稍有松懈麻痹,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。本题就胎儿的某种疾病影响因素做了详细的调查与记录见附表1,根据附表1中的数据,利用统计学知识判断到底该疾病的诱发因素有哪些?
模型分析
考虑到题目给出了病例组与对照组,且给出的多个影响因素为分类变量,不能使用线性回归模型,因此,考虑使用Logistic回归分析数学模型进行了统计分析。在考虑用逐步后退法分析出该疾病的诱发因素。
Logistic回归分析数学模型是专门用来分析疾病与危险因素间联系的一种统计方法。假设影响因素对疾病的影响是独立的,利用SPSS软件包输入数据,拟合出Sig值,Sig值为结果可信程度的一个递减指标(即将观察结果认为有效即具有总体代表性的犯错概率)。本模型中取a=0.05(在许多研究领域,0.05的Sig值通常被认为是可接受错误的边界水平)。当Siga时,就认为此Sig值对应的因素即为该疾病的诱发因素。
三、符号说明
y :患病情况(0=未患病 1=患病)
x1 :鼻炎家族史(0=无 1=有)
x2 :主(被)动吸烟(0=无 1=有)
x3 :孕早期病毒感染(0=无 1=有)
x4 :孕期用药(0=无 1=有)
x5 :先兆早产(0=无 1=有)
x6 :流产史(0=无 1=有)
x7 :早产(0=无 1=有)
x8 :剖宫产(0=无 1=有)
x9 :孕期营养(0=一般 1=好)
x10:孕期活动量(0=小 1=一般)
x11:出生体重(<2.5=1 2.5~4=2 ≥4=3)
x12:妊娠反应(轻1 中2 重3)
P:在m个自变量的作用下患病的概率
: 回归系数(j=0,1…12)
Si:Sig的检验值
Smax:Si的最大值
S: Sig的临界值Sig=0.05
Sig: “显著性”,当0.01Sig0.05,则为差异显著,如果Sig0.01,则差异极显著。
四、模型假设
1、影响因素对疾病的影响是独立的。
2、各个因素的有无影响程度大小不考虑。
3、除这12种因素外有可能引起该病的因素不考虑。
五、模型建立
1、y=1 患病;y=0 未患病;自变量
在m个自变量的作用下患病的概率记作:
(1)
即:
(2)
将P作logit转换为,有
(3)
2、建立似然函数模型:
(4)
通过,求出,代入(3)得logistic回归方程同时也可求出Sig值。
m=12,j=(1,2…200)
3、逐步回归的后退法:
1 根据原始数据由SPSS软件得出多元线性回归结果;
2 找到最大的Sig值Smax与临界值S=0.05比较,如果SmaxS,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回(1),否则进入(3)。
3 如果SmaxS,则逐步回归结束,即剩下的变量统计显著水平高。
根据上面步骤,可以简单绘出流程如下:
原始数据
原始数据
SmaxS
回归结果
检验值Si
最大值Smax
临界值S
SmaxS剔除
回归模型
SPSS
计算查找
判断
所剩因子
六、模型求解:
借助于SPSS统计软件完成
具体的过程如下:
Data View:(数据窗口)(见附表1)
Variable View:(变量窗口)
再如下:Analyze→Regression→Linear
再如下:Linear→dependent:y
independent:x1-x12
然后单击OK,得:
以上的Coefficient,为回归参数表。再根据逐步回归的后退法,得:
文档评论(0)