- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代统计分析方法与应用第9章:定性数据的建模分析
⑴点选SPSS软件的Analyze→Regression→BinaryLogistic命令,进入Logistic回归对话框如下所示: 利用SPSS软件进行估计的步骤如下: ⑵将y送入Dependent框; ⑶将x1、x2、x3送入Covariate框中; ⑷点击[OK],系统输出以下结果: 上表中SEX(性别)、AGE(年龄)、X2(月收入)是3个自变量,Wald是回归系数检验的统计量值, Sig是Wald检验的显著性概率,R是偏相关系数。可以看到,X2(月收入)不显著,决定将其剔除。用y对性别与年龄两个自变量做回归,输出结果见下表。 可以看到,SEX、AGE两个自变量都是显著的,因而最终的回归方程为: 以上方程式表明,女性乘公共汽车的比例高于男性,年龄越高乘车的比例也越高。 SPSS软件没有给出Logistic 回归的标准化回归系数,对于Logistic 回归,回归系数也没有普通线性回归那样的解释,因而计算标准化回归系数并不重要。如果要考虑每个自变量在回归方程中的重要性,不妨直接比较Wald值(或Sig值),Wald值大者(或Sig值小者)显著性高,也就更重要。当然这里假定自变量间没有强的复共线性,否则回归系数的大小及其显著性概率都没有意义。 第4节 Logistic回归的方法与步骤 鉴于Logistic回归与判别分析的相似性,我们可以对比两种方法的相似性和不同点。Logistic回归的自变量可以是定量变量或定性变量(需要编码),这样可以检验自变量对于Logistic回归模型的贡献、自变量的显著性以及Logistic模型的判别精度。Logistic回归一般有以下几个步骤: ⑵将一部分样品用于估计Logistic函数(分析样品),另一部分样品用于检验模型的判别精度(保留样品)。 ⑴选择自变量和因变量。这里因变量为分组变量(限于篇幅,我们仅介绍因变量分两组的情况),自变量可以是定量变量和定性变量。Logistic回归对于资料数据有较强的稳健性(robustness),无须各组自变量的协差阵相等的假定。 ⑶模型中假定自变量之间不存在高度相关,因变量发生概率的模型服从于Logistic模型。这样我们可以进行Logistic回归估计。 ⑷估计模型参数,评估拟合情况。我们选择回归估计的方法对回归参数进行估计并检验回归参数的显著性,对模型的拟合程度检验。 ⑸解释所得到的模型结果。通过参数的显著性和符号、大小来解释自变量对因变量的意义。 ⑹通过保留样本来验证模型的判别精度。 Logistic回归的逻辑框图如下: * * 第9章 定性数据的建模分析 对数线性模型基本理论和方法 对数线性模型分析的上机实验 Logistic回归基本理论和方法 Logistic回归的方法与步骤 第三章我们曾讨论过定性数据的列联表分析,对数线性模型是进一步用于离散型数据或整理成列联表格式的数据的统计分析工具。它可以把方差分析和线性模型的一些方法应用到对交叉列联表的分析中,从而对定性变量间的关系作更进一步的描述和分析。列联表分析无法系统地评价变量间的联系,也无法估计变量间交互作用的大小,而对数线性模型是处理这些问题的最佳方法。当被解释变量是非度量变量时,可以用判别分析。然而当被解释变量只有两组时,Logistic回归由于多种原因更受欢迎。首先,判别分析依赖于严格的多元正态性和相等协差阵的假设,这在很多情况下是达不到的。 Logistic回归没有类似的假设,而且这些假设不满足时,结果非常稳定。其次,即使满足假定,许多研究者仍偏好Logistic回归,因为它类似于回归分析。两者都有直接的统计检验,都能包含非线性效果和大范围的诊断。因为这些和更多技术原因,Logistic回归等同于两组的判别分析,在很多情况下更加适用。再者,Logistic回归对于自变量没有要求,度量变量或者非度量变量都可以进行回归, 这样,本章仅介绍定性数据建模的对数线性模型和Logistic回归方法。 第1节 对数线性模型基本理论和方法 本节将利用2×2维的交叉列联表来说明对数线性模型的基本理论和方法,同时利用SPSS软件对真实的经济定性数据作分析。 从下面的2×2维交叉列联表及其概率表,介绍对数线性模型的基本理论和方法。 在对数线性模型分析中,要先将概率取对数,再分解处理,用公式表示如下: 上式可以简写为: 该式的结构与有交互效应,且各水平均为2的双因素方差分析模型的结构相似,因此仿照方差分析,可以有如下关系式: 对上面三式各取其平均数为: 若记: 其中: 移项,可得与有交互效应的双因素方差分析数学模型极为相似的关系式: 在实际分析
文档评论(0)