定类或定序因变量回归分析.pptxVIP

下载本文档

1
0
约3.25千字
约 37页
2022-10-27 发布于上海
举报
版权申诉

定类或定序因变量回归分析.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

会计学; 线性回归模型在定量分析中广为流行，然而当因变量是一个定类变量而不是一个连续变量时，很难应用线性回归模型。如政治学中研究是否选举某候选人，经济学研究中涉及的是否销售或购买某种商品，如在社会学和人口学研究中所涉及的如犯罪、逃学、迁移、结婚、离婚、生育、患病等等都可以按照二分类变量或多分类来测量。又如在研究态度与偏好等心理现象时也经常按几个类型进行测量的，如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。另外，有时对一些连续变量也要转换成类型变量，如在分析升学考试的影响因素时，将考生分为录取线以上和录取线以下，只要选定一个分界点，连续变量便可以被转换成定类变量。; 从统计理论上看，在进行最小二乘法的参数估计时，我们仅仅关注残差项ε的分布，很少对因变量Y所服从的分布予以关注，实际上,我们拥有Y的信息要远远大于拥有残差项ε的信息。因变量Y服从正态分布的推断来源于残差项服从正态分布，因为Y 是残差项的线性函数。事实上，社会经济现象往往有不同于正态分布的其他分布，例如：（1）二项分布（binomial distribution）（2）泊松分布（Poisson） ; 二、线性概率模型; 2、线性概率模型存在的问题 ; 三、简单对数比率回归;表1 概率、比率和对数比率; 该模型即为logit回归模型。logit回归模型实际上是普通多元线性回归模型的推广，但它的误差项服从二项分布而非正态分布，因此，需要采用极大似然估计方法进行参数估计，参数?称为logit回归系数，表示当其他自变量取值保持不变时，该自变量取值增加一个单位引起的发生比自然对数值的变化量。; 2、发生比;四、极大似然估计的基本思想 1) 概率问题例1、假定我们要估计一样本中男性的发生概率。以s表示样本中男性的数量；N是样本规模；π是总体中男性的概率（ ?=0.5 ）。根据贝努利公式：其中k!=k(k-1)…2.1 10个样本中有3个男性的概率为：如果我们已知样本中s、N及其概率分布的信息，需要估计总体特征?，则需要借助极大似然估计法来完成。极大似然估计ML就是估计这样一个参数值，由于该参数的存在可以使得被观察的事件最有可能发生。; 2) 似然函数当已知N 和?，求s发生的可能性有多大，所建立的函数，称为概率函数。而当已知N 和s，求?发生的可能性有多大，所建立的函数，称为似然函数。二者的差异：第一、前者是在参数已知下的数据的函数，后者是在数据已知条件下的参数的函数。第二、参数值是由可能性最高的值决定，我们称该值为极大似然估计。 L（π /s=3, N=10）= 由于极大似然估计就是估计参数值?，使得样本发生的可能性最大，故求最大化的前提是对上式求偏导： ;解得上式可以得到?的估计值为0.3 ;例2，运用极大似然估计法估计泊松分布中参数;LnL = -N?+?yiln(?)-?ln(yi!) ?lnL/?? = -N +?yi/? ? = ?yi / N;例3、运用极大似然估计法估计正态分布中的参数 ;例3、估计logistic回归模型中的参数由于logistic模型是二项分布，其似然函数为： L= ; 通过三个例子的比较，我们可以看出在线性回归中，似然函数是通过对似然方程求偏导数得到的，对于未知参数是线性的，容易求解,但是对于logistic回归，似然函数是α和β的非线性函数，求解比较困难，需要借助于计算机，通过迭代计算完成。最大似然估计与OLS估计的统计性质几乎完全相同，即具有一致性、渐进有效性和渐进正态性。一致性是指当样本规模增大时，模型参数估计逐渐向真值收敛，即估计将近似于无偏。所谓渐进有效性是指当样本规模增大时，参数估计的标准误相应缩小。所谓渐进正态性是指随着样本规模增大，最大似然估计值的分布渐进于正态分布。 ;五、logistic回归模型及参数估计的评价;2、拟合优度检验;2）、Hosmer-Lemeshow 拟合优度检验该方法通常适用于自变量很多，或自变量为连续变量的情形。HL方法根据预测概率的大小将所有观察单位十等分，然后根据每一组中因变量的实际值与理论值计算Peason卡方，其统计量为：其中G 代表分组数，且G?10；ng为第g组中的观测值数；yg第g组事件的观测数量；pg为第g组的预测事件概率；ngpg为事件的预测值，实际上它等于第g组的观测概率和。 ;3）对数似然比卡方检验