条件logistic回归和logitboost算法在建立先天性心脏病概率预测模型中的结合应用.pdfVIP

条件logistic回归和logitboost算法在建立先天性心脏病概率预测模型中的结合应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2007年中国卫生统计学术大会论文集西安 概率预测模型中的结合应用 陈广 陈景武王金才 (潍坊医学院预防医学系261042) 【摘要】目的从众多由专业知识初选出的与先天性心脏病发生有联系的研究因素中筛选出 危险因素,同时建立适合网络实现的先天性心脏病发生率的预测咨询模型,为课题成果的网络化 奠定基础。方法采用了1:2配比设计的病例对照研究,对72名病例儿童和144名对照儿童的 亲生父亲和(或)母亲,采用统一的调查表就51个研究因素进行现场调查,使用了单因素条件 回归分析从51个研究因素中筛选出23个有统计学意义的可疑危险因素,经过数据结构分析、相 关因素分组分析、变量共线性诊断,最终筛选出16个变量进入多元Logistic逐步回归分析,最 终筛选出与先天性心脏病发生有关的危险因素7个,各变量间不存在交互作用,它们是:母亲学 历,出生时缺氧或窒息、孕12周内感冒、本胎孕前妊娠次数、孕早期感染史、孕3个月内B超 检查、孕生活事件精神刺激,并建立了logitboost概率预测模型。结论利用条件109istic回归与 logitboost算法,在探索先天性心脏病危险因素的同时,解决了配比设计资料的概率预测问题, 建立了logitboost预测模型。 【关键词】先天性心脏病;条件logistic回归;109itboost算法;数据挖掘 我国每年约有10万名先天性心脏病患儿出生[1】,给社会和家庭带来了沉重的精 神和经济负担,先天性心脏病已成为影响我国儿童身心健康和人口生存质量的重大 公共卫生问题。因此,提高人们对先天性心脏病的危害的认识,教会人们如何避免 与先天性心脏病发生有关的危险因素,对于我国青少年的健康成长和人口素质提高 具有重要的社会意义【2】。本课题在深入研究先天性心脏病危险因素的同时,探索适合 网络化咨询的预测模型,希望对流行病学成果的网络化推广起到促进作用。 对象与方法 1.研究对象:潍坊市市级医院、计生和妇幼保健机构2004年1月_2005年1 月,经统一诊断标准确诊的年龄不超过7岁的单纯型先天性心脏病病例(包括住院、 门诊和死胎),对于已经出院和已经死亡的患者,查阅其原始病案记录,由儿科医生 确定是否入选。 对于调查期间的住院或门诊患者,对照来自该院或门诊的其他疾病患者;对于 调查期间己出院或死亡的患者,对照来自患者的同一居住区。 2.研究方法与内容: 按1:2匹配设计样本含量估计公式,算得病例数为64,对照数为128,按10% 的损失率计算,根据实际情况和调查需要增加11个病例和22个对照,使病例数达 431 2007年中国卫生统计学术大会论文集西安 到75个,对照数达到150个[8】。 使用统一的“先天性心脏病危险因素调查表”,以询问的方式对病例和对照及其 亲生父母逐一调查,由调查员口头提问,将答案写入调查表。 调查内容包括本胎孩子出生情况、孩子父母亲基本情况、孕期前后母亲情况、有 害物质接触等。 3.统计学分析:调查表经审核合格后,录入计算机,对变量进行量化和赋值, 31。 卡托大学开发的weka数据挖掘软件中的logitboost算法进行判别分析‘1 表1先天性心脏病影响因素的赋值方法 2007年中国卫生统计学术大会论文集西安 (续表1) 433 2007年中国卫生统计学术大会论文集西安 结果 1.单因素条件Logistic回归分析,筛选出可疑危险因素:对表1中的51个变量 的可疑危险因素。 表2单因素条件Logistic回归分析结果 2.经相关因素分组分析与变量共线性诊断,最终筛选出16个变量进入多因素条 因素条件LogiStic回归分析,有统计学意义的变量共7个,分别是:X2(母亲学历)、

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档