第十讲定类或定序因变量回归分析_408009601.ppt

第十讲定类或定序因变量回归分析_408009601.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十讲定类或定序因变量回归分析_408009601

SPSS操作程序 1、选择logistic回归程序: ——点击主菜单中的Analyze ——然后点击Regression ——再点击Ordinal,屏幕上出现对话窗口 2、选定模型 Dependent——选择一个有序分类因变量。 Factor——选择若干分类自变量。 Covariates——用于选入连续型的自变量。 择系统默认值,点击OK钮,运行所选命令 结果解释 数据汇总与模型的似然比检验。 拟合优度检验(Pearson,Deviance检验)。 参数估计结果。 第十讲 定类或定序因变量回归分析 当因变量是一个定类变量而不是定距变量时,线性回归模型受到挑战。 如政治学中研究是否选举某候选人,经济学研究中涉及的是否销售或购买某种商品,社会学和人口学研究中所涉及的如犯罪、迁移、婚姻、生育、患病等等都可以按照二分类变量或多分类来测量。 一、问题的提出 在研究态度与偏好等心理现象时也经常按类型进行测量的,如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。 连续变量转换成类型变量的情形,如在分析升学考试的影响因素时,将考生分为录取线以上和录取线以下。 从统计理论上看,最小二乘法关注正态分布,然而社会经济现象往往有不同于正态分布的其他分布,例如: (1)二项分布(binomial distribution) (2)泊松分布(Poisson) 二、线性概率模型 1、模型建立 以最小二乘法为基础的线性回归方程是估测因变量的平均值,而二分变量的均值有一个特定的意义,即概率。用普通线性回归方程估测概率,就是所谓的线性概率回归。用公式表示为: P = a + ∑βiXi + ε 对二项分布线性概率模型的结果解释: 在其他变量不变的情形下,x每增加一个单位,事件发生概率的期望将变动β个单位。 例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治资本)的概率,模型为: P = -0.39 +0.01A +0.04E +0.03U 其中:P—党员概率, A—年龄, E—受教育年限, U—单位身份 1)无意义的解释 从解释力上看,由于概率的值是有边界的,在0与1之间。但林楠方程很有可能要超过该限制,因变量的估计值可能是负数,也可能大于1,因此模型的结果是无意义的。例如,运用林楠方程,我们发现如果年龄为100岁,受教育程度超过10年,则入党的概率约等于1。 2)非线性关系 2、线性概率模型存在的问题 三、简单对数比率回归 1、模型建立 既然用线性概率回归存在局限性,能否用比率做因变量呢?比如用男女比率作因变量,用成功与不成功之比做因变量。用比率做因变量存在的问题是,比率是非对称的. 表1 概率、比率和对数比率 概率 0.01 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.99 比率 0.01 0.11 0.25 0.43 0.67 1.00 1.50 2.33 4.00 9.00 99 对数比率 -4.60 -2.20 -1.39 -0.85 -0.41 0.00 0.41 0.85 1.39 2.20 4.60 一个简单的解决办法就是取对数,结果就是所谓对数比率(logit)。若用P代表某事件的概率,则对数比率函数的定义为 g(P)= log (P/1-P) 以对数比率为因变量对自变量X1,X2,X3……做回归称为对数比率回归(logistic regression),其方程式为: 该模型即为logit回归模型。logit回归模型是普通多元线性回归模型的推广,但它的误差项服从二项分布,因此需要采用极大似然估计方法进行参数估计,参数?称为logit回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起的发生比自然对数值的变化量。 2、发生比 发生比是事件的发生频数与不发生频数之间的比,即: Odds=(事件发生频数)/(事件不发生频数) 当比值大于1时,表明事件更有可能发生。比如一个事件发生的概率为0.6,事件不发生的概率为0.4,发生比等于0.6/0.4=1.5。事件发生的可能性是不发生的1.5倍。 四、logistic回归模型的检验与评价 1、Logistic回归模型估计的假设前提 第一、数据来自于随机样本。 第二、因变量Yi被假设为K个自变量Xk(k=1,2,…,K)的函数。 第三、正如OLS回归,logistic回归也对多重共线性有所限制,自

您可能关注的文档

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档