定类或定序因变量回归分析(课堂PPT).pptVIP

定类或定序因变量回归分析(课堂PPT).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十讲 定类或定序因变量回归分析 ; 当因变量是一个定类变量而不是定距变量时,线性回归模型受到挑战。 如政治学中研究是否选举某候选人,经济学研究中涉及的是否销售或购买某种商品,社会学和人口学研究中所涉及的如犯罪、迁移、婚姻、生育、患病等等都可以按照二分类变量或多分类来测量。 ; 在研究态度与偏好等心理现象时也经常按类型进行测量的,如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。 连续变量转换成类型变量的情形,如在分析升??考试的影响因素时,将考生分为录取线以上和录取线以下。 ; 从统计理论上看,最小二乘法关注正态分布,然而社会经济现象往往有不同于正态分布的其他分布,例如: (1)二项分布(binomial distribution) (2)泊松分布(Poisson) ; 二、线性概率模型; 例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治资本)的概率,模型为: P = -0.39 +0.01A +0.04E +0.03U 其中:P—党员概率, A—年龄, E—受教育年限, U—单位身份;1)无意义的解释 从解释力上看,由于概率的值是有边界的,在0与1之间。但林楠方程很有可能要超过该限制,因变量的估计值可能是负数,也可能大于1,因此模型的结果是无意义的。例如,运用林楠方程,我们发现如果年龄为100岁,受教育程度超过10年,则入党的概率约等于1。 2)非线性关系 ; 三、简单对数比率回归 ;表1 概率、比率和对数比率; 一个简单的解决办法就是取对数,结果就是所谓对数比率(logit)。若用P代表某事件的概率,则对数比率函数的定义为 g(P)= log (P/1-P) 以对数比率为因变量对自变量X1,X2,X3……做回归称为对数比率回归(logistic regression),其方程式为: ; 该模型即为logit回归模型。logit回归模型是普通多元线性回归模型的推广,但它的误差项服从二项分布,因此需要采用极大似然估计方法进行参数估计,参数?称为logit回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起的发生比自然对数值的变化量。; 2、发生比;四、logistic回归模型的检验与评价;2、拟合优度检验;1)皮尔逊卡方检验 皮尔逊卡方检验主要用于检验残差项的大小。计算公式: 其中yi是观察值(0或1),pi是估算值的概率, i=1,2…n,分母是估算值的标准差,自由度为n-J-1,其中J为自变量数目。 ;2)Hosmer-Lemeshow 拟合优度检验 该方法通常适用于自变量很多,或自变量为连续变量的情形。HL方法根据预测概率的大小将所有观察单位十等分,然后根据每一组中因变量的实际值与理论值计算Peason卡方,其统计量为: 其中G 代表分组数,且G?10;ng为第g组中的观测值数;yg第g组事件的观测数量;pg为第g组的预测事件概率;ngpg为事件的预测值,实际上它等于第g组的观测概率和。 ;3)对数似然比卡方检验 对数似然比是用较复杂模型与基本模型进行比较。通常将似然取对数并乘以-2,即-2logL,简称对数似然。 基本模型以独立模型表示: 用L0表示独立模型的似然,L1表示非独立模型的似然,那么对数似然比定义为: 遵循卡方分布,其自由度为非独立模型的自变量数目,可用于检验复杂模型中自变量对似然率的增加是否显著,越大越好。 ;3、logit模型回归系数的假设检验;五、模型解释;六、多项对数比率回归; 需要注意的是:1)就系数解释和检验而言,多项对数比率回归和简单对数比率回归相同。2)方程组在统计上不独立,必须同时估算,不可一一求解。;SPSS上的应用: 1)Analyze—Regression—Multinomial Logistic 2)Dependent——用于选入无序多分类的因变量 3)Factor ——用于选入分类自变量,可以是有序或无序多分类,系统会自动生成虚拟变量。 4)Covariates——用于选入连续型的自变量。 选择系统默认值,点击OK钮,运行所选命令 5)结果解释 数据汇总与模型的似然比检验。 拟合优度检验(Pearson,Deviance检验)。 参数估计结果。 ;七、定序变量对数比率 ; 对于定序变量,常常假设升级的作用是一样的,即在方程组中,各个方程的斜率项是相同的,β1=β2=……=βj-1 ,上式可表示为: ;2、升级比; 例如升学率的研究。将学校依等级高低分为小学、初中、高中和

您可能关注的文档

文档评论(0)

789 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳春市海霄网络科技有限公司
IP属地广东
统一社会信用代码/组织机构代码
91441781MA52HUKW1K

1亿VIP精品文档

相关文档