第十讲定类或定序因变量回归分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十讲定类或定序因变量回归分析; 在研究态度与偏好等心理现象时也经常按类型进行测量得,如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。 连续变量转换成类型变量得情形,如在分析升学考试得影响因素时,将考生分为录取线以上和录取线以下。 ; 从统计理论上看,最小二乘法关注正态分布,然而社会经济现象往往有不同于正态分布得其她分布,例如: (1)二项分布(binomial distribution) (2)泊松分布(Poisson) ; 二、线性概率模型; 例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治资本)得概率,模型为: P = -0、39 +0、01A +0、04E +0、03U 其中:P—党员概率, A—年龄, E—受教育年限, U—单位身份;1)无意义得解释 从解释力上看,由于概率得值就是有边界得,在0与1之间。但林楠方程很有可能要超过该限制,因变量得估计值可能就是负数,也可能大于1,因此模型得结果就是无意义得。例如,运用林楠方程,我们发现如果年龄为100岁,受教育程度超过10年,则入党得概率约等于1。 2)非线性关系 ; 三、简单对数比率回归 ;表1 概率、比率和对数比率;9; 一个简单得解决办法就就是取对数,结果就就是所谓对数比率(logit)。若用P代表某事件得概率,则对数比率函数得定义为 g(P)= log (P/1-P) 以对数比率为因变量对自变量X1,X2,X3……做回归称为对数比率回归(logistic regression),其方程式为: ; 该模型即为logit回归模型。logit回归模型就是普通多元线性回归模型得推广,但她得误差项服从二项分布,因此需要采用极大似然估计方法进行参数估计,参数?称为logit回归系数,表示当其她自变量取值保持不变时,该自变量取值增加一个单位引起得发生比自然对数值得变化量。; 2、发生比;四、logistic回归模型得检验与评价;2、拟合优度检验;1)皮尔逊卡方检验 皮尔逊卡方检验主要用于检验残差项得大小。计算公式: 其中yi就是观察值(0或1),pi就是估算值得概率, i=1,2…n,分母就是估算值得标准差,自由度为n-J-1,其中J为自变量数目。 ;2)Hosmer-Lemeshow 拟合优度检验 该方法通常适用于自变量很多,或自变量为连续变量得情形。HL方法根据预测概率得大小将所???观察单位十等分,然后根据每一组中因变量得实际值与理论值计算Peason卡方,其统计量为: 其中G 代表分组数,且G?10;ng为第g组中得观测值数;yg第g组事件得观测数量;pg为第g组得预测事件概率;ngpg为事件得预测值,实际上她等于第g组得观测概率和。 ;3)对数似然比卡方检验 对数似然比就是用较复杂模型与基本模型进行比较。通常将似然取对数并乘以-2,即-2logL,简称对数似然。 基本模型以独立模型表示: 用L0表示独立模型得似然,L1表示非独立模型得似然,那么对数似然比定义为: 遵循卡方分布,其自由度为非独立模型得自变量数目,可用于检验复杂模型中自变量对似然率得增加就是否显著,越大越好。 ;3、logit模型回归系数得假设检验;五、模型解释;六、多项对数比率回归; 需要注意得就是:1)就系数解释和检验而言,多项对数比率回归和简单对数比率回归相同。2)方程组在统计上不独立,必须同时估算,不可一一求解。;SPSS上得应用: 1)Analyze—Regression—Multinomial Logistic 2)Dependent——用于选入无序多分类得因变量 3)Factor ——用于选入分类自变量,可以就是有序或无序多分类,系统会自动生成虚拟变量。 4)Covariates——用于选入连续型得自变量。 选择系统默认值,点击OK钮,运行所选命令 5)结果解释 数据汇总与模型得似然比检验。 拟合优度检验(Pearson,Deviance检验)。 参数估计结果。 ;七、定序变量对数比率 ; 对于定序变量,常常假设升级得作用就是一样得,即在方程组中,各个方程得斜率项就是相同得,β1=β2=……=βj-1 ,上式可表示为: ;2、升级比; 例如升学率得研究。将学校依等级高低分为小学、初中、高中和大学四类。初中升高中得比率不仅就是初中毕业生和高中毕业生得比率,还应包括大学毕业生,因为她们也完成了初中到高中得升级过程。 升级比在统计上就是各自独立得,因而可以对照简单对数比率回归一一估算。加总各独立升级比率回归得对数似然

文档评论(0)

kch + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年10月08日上传了教师资格证

1亿VIP精品文档

相关文档