- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用分类树模型筛选logistic回归中的交互因素.pdf
·114·
应用分类树模型筛选logistic回归中的交互因素
复旦大学统计系(200433)赵自强郑 明△
【提要】 目的探索自动筛选logistic模型中交互作用因素的方法。方法借助一个实例,说明分层、分类树与10.
点。结论在logistic回归分析中,分类树可以有效地用于自动筛选可能的交互效应因素。
【关键词】分类树;logistic回归模型;交互作用
在应用回归模型分析因变量与自变量之间的回归关
系时,常常需要考虑各自变量之间对因变量可能存在的 明。设任意两组二分类四格表如表1。
交互作用。在自变量较少的情况下,可通过检验交互作 表1两组二分类资料的变量取值定义用表
用项的回归系数推断这些自变量是否对因变量构成交互
作用。但当自变量较多时,回归模型中要考虑交互作用
就相当复杂了;若存在高阶交互作用,要通过对交互作用
项的回归系数检验推断回归模型中的各种情况,就更复
杂了。所以在实践中通过logistic回归模型分析交互作
用,尤其是高阶交互作用,很难真正实现。 表示P(Y
另外,在作回归分析时,常常需要对连续型自变量 x)—笋曼等耥或等价地表示为
logit(P)=po+卢1z (1)
进行分割成若干个分段的自变量,这就存在如何选择
假设y是二分类变量,则首先利用分类树对数据
最合适的分割点问题,对于回归分析而言,很难直接探
进行初步分析,获得一个用分类树表示的分层统计分
索到最合适的分割点,往往根据经验和人为地确定某
析并且每个分层的统计检验均是有显著意义的。
几个点作为分割点,其回归效果很可能因分割点选择
根据分类树的结果构造相应的logistic回归模型,
不理想而受到影响。
利用分类树以获得各自变量之间可能存在的交互关
分类树模型在本质上就是按各个自变量对因变量
系,按照模型中交互作用项的阶数,从高到低依次作统
的关联程度依次逐个分层,直至最后分层的统计检验
计检验,剔除不显著的高阶交互作用项,然后重新拟合
无统计学意义为止,然而分层统计在本质上就是交互
模型和重复考察各个最高阶的交互作用项,直至所有
作用背景下的简单效应统计分析,所以一些文献报道
各项最高阶的交互作用项均显著为止,然后添加需要
可以借助回归树和分类树筛选可能的交互作用项。虽
嵌套的低阶交互作用项或主效应项,重新由高阶到主
然树模型可以筛选交互作用,但它无法分析自变量的
效应对各项作检验,建立完备的logistic模型。
线性叠加效应,并且往往把一些自变量之间的线性叠
加效应的关系错误地用分层关系进行表达。而回归模 实 例
型不仅可以较方便地表达自变量之间的线性叠加效
例:为了探讨患肺癌与吸烟、体育锻炼以及家族病
应。而且在已知树模型结果的情况下,可以对应构造相
史的关系,研究者采用病例对照研究共收集了395例
应的回归模型表达分层的情况和实现分层统计分析。
肺
文档评论(0)