- 1、本文档共73页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章列联表与非线性回归分析
Analyze-Regression- Binary Logistic 自变量为定量变量时,把因变量选入DependentVariable,把自变量选入Covariates,OK即可得到结果。 自变量为定量变量及定性变量时,把因变量选入DependentVariable,把定量变量选入Covariates,然后点Categorical,再把定性变量选入Categorical Covariate,回到主对话框, 可在options选择Hosmer-Lemeshow-goodness-of-fit检验(检验拟合优度) 点击OK即可得到结果。 SPSS软件使用说明 对数线性模型 多项分布对数线性模型 Poisson对数线性模型 高维列联表和多项分布对数线性模型 高维列联表在计算机软件的选项可有所不同,而且可以构造一个所谓(多项分布)对数线性模型(loglinear model)来进行分析。 利用对数线性模型的好处是不仅可以直接进行预测,而且可以增加定量变量作为模型的一部分。 多项分布对数线性模型 现在简单直观地通过二维表介绍一下对数线性模型,假定不同的行代表第一个变量的不同水平,而不同的列代表第二个变量的不同水平。用mij代表二维列联表第i行,第j列的频数。人们常假定这个频数可以用下面的公式来确定: 这就是所谓的多项分布对数线性模型。这里ai为行变量的第i个水平对ln(mij)的影响,而bj为列变量的第j个水平对ln(mij)的影响,这两个影响称为主效应(main effect);eij代表随机误差。 二维列联表的更完全的对数线性模型为 这里的(ab)ij代表第一个变量的第i个水平和第二个变量的第j个水平对ln(mij)的共同影响(交叉效应)。即当单独作用时,每个变量的一个水平对ln(mij)的影响只有ai(或bj)大,但如果这两个变量一同影响就不仅是ai+bj,而且还多出一项。 选项为Analyze-Loglinear-General, 首先选择格子中频数的分布,这里是多项分布 (其默认值是Poisson对数线性模型). 把变量选入Factors(因子); 再选Model(模型),如果选Saturated(饱和模型),那就是所有交叉效应都要放入模型;但如果不想这样,可以选Custom(自定义),在Building Terms(构造模型的项)选Main effect(主效应),再把三个变量一个一个地选进来(如果两个或三个一同选入,等于选入交叉效应). 如果想要知道模型参数,在Options中选择Estimates。 最后Continue-OK即可得出结果. SPSS软件使用说明 Poisson对数线性模型 有的时候,类似的高维表并不一定满足多项分布对数线性模型。例如:关于哮喘病人个数和空气污染程度,年龄和性别的关系,收集某地在一段时间的60组在不同空气污染状态的不同年龄及不同性别的人的发生哮喘的人数。其中性别为定性变量S(sex, 1代表女性,2代表男性),空气污染程度P也是定性变量(polut, 1、2、3分别代表轻度、中度和严重污染),年龄A (age)为定量变量,为那一组人的平均年龄;还有一列计数C (count)为这一组的哮喘人数。 这个表格和前面的列联表的不同点在于每一格的计数并不简单是前面三个变量的组合的数目(某个年龄段,某种性别及某种污染下的人数),而是代表了某个年龄段,某种性别及某种污染下发生哮喘的人数。 Poisson分布简介在某些固定的条件下, 人们认为某些事件出现的次数服从Poisson分布, 比如在某一个时间段内某种疾病的发生病数, 显微镜下的微生物数, 血球数, 门诊病人数, 投保数, 商店的顾客数, 公共汽车到达数, 电话接通数等等. 然而, 条件是不断变化的. 因此, 所涉及的Poisson分布的参数也随着变化. Poisson对数线性模型 假定哮喘发生服从Poisson分布;但是由于条件不同,Poisson分布的参数l也应该随着条件的变化而改变。这里的条件就是给出的性别、空气污染程度与年龄。当然,如何影响以及这些条件影响是否显著则是我们所关心的。这个模型可以写成 这里m为常数项,ai为性别(i=1,2分别代表女性和男性两个水平),bj为空气污染程度(j=1,2,3代表低、中高三个污染水平),x为连续变量年龄,而g为年龄前面的系数,eij为残差项。 Analyze-Loglinear-General, 首先选择格子中频数的分布,这里是Poisson分布。 然后把两个变量(sex,polut)选入Factors(因子),把age选入Cell Covariate(s)。 再选Model(模型),这里以选Custom(自定义),
文档评论(0)