11统计模型与统计实验第二篇第四章因变量为0-1的二值回归模型1.pptx

下载文档

0
0
约1.32千字
约 19页
2024-08-09 发布于浙江
举报
版权申诉
保障服务

11统计模型与统计实验第二篇第四章因变量为0-1的二值回归模型1.pptx

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

统计系因变量为0-1的二值回归模型

什么是因变量为0-1的问题？现实生活中有一些问题是需要做出“是”/“否”的选择。例如农村劳动力是否外出务工？已婚妇女是否进入劳动力市场找工作挣钱？25岁之前是否结婚？结婚后是否马上生小孩？父母有小孩后是否幸福？等等

什么是因变量为0-1的问题？数据挖掘有一些问题需要猜测（预测）某个状态是否可能出现。例如根据各种反馈信号预测是否有障碍物用户行为研究中需要根据用户的已知行为判断用户是否可能购买特定商品等等。

什么是因变量为0-1的问题？以上问题的研究对象可以转化为0-1形式的数值，并采用基本的概率模型进行估计。其中因变量为0-1变量的二值变量，自变量包含可能影响这个二值变量的各种可能因素。本章将介绍如何建立此类选择问题的统计模型，并使用这类模型解释现实问题。

因变量为二值变量的基本模型有哪些？?

G函数的作用让等号右侧的拟合值：不超出0-1范围

线性概率模型（LPM）的优缺点线性概率模型（LPM）的优点：能够很简洁地用于解释自变量和因变量“条件均值”之间的线性关系。例如，地方政府关心修路以后，某农村地区外出人口比例会增加多少的问题？即要回答的答案是，当X增加一个单位时，外出人数比例在平均意义上会增加a个百分点。

线性概率模型（LPM）的优缺点线性概率模型（LPM）的缺点：拟合值可能会超出0-1范围，得到不合理的拟合值。（尤其是当因变量的观测比例过于接近0或1的时候，或者自变量中包含较多异常值的情况）一般线性概率模型不用于预测类问题。

LOGIT和PROBIT模型的优缺点LOGIT和PROBIT模型的优点：拟合值不会超过0-1范围，多数情况下不用担心出现不合理的预测值LOGIT和PROBIT模型的缺点：系数估计值不是平均偏效应（或称边际系数）

LOGIT模型和PROBIT模型

如何刻画边际效用？?

平均偏效应?

发生比?

LOGIT模型和PROBIT模型显著性的判断“可决系数”线性模型一般通过可决系数对模型拟合优度进行综合度量；可决系数越大,说明在Y的总变差中由模型做出了解释的部分占的比重越大,模型的拟合优度越高。可决系数越小,说明在Y的总变差中由模型解释了的部分占的比重越小,而未被模型做出的解释部分越大,则模型对样本的拟合程度越差。Logit模型和Probit模型的因变量不是连续型变量，不能得到类似于经典线性回归模型的可决系数。

LOGIT模型和PROBIT模型显著性的判断?

系数估计值的显著性检验根据经典线性回归一样的估计方法，可以得到一个T检验系数估计值。这个估计值是假定残差服从正态分布得到的。然而，Logit模型和Probit模型的残差不服从正态分布，残差一定会存在异方差问题（具体可参考参考文献的详细说明）。对此，需要得到一个稳健的检验统计量。这里不详细说明这个稳健统计量的公式。

本节小结线性概率模型、Logit模型和Probit模型三种模型的优缺点边际效用：平均偏效应发生比：Logit模型可决系数与伪可决系数模型检验：F检验和似然比检验系数检验

您可能关注的文档

文档评论（0）

医药前沿 + 关注: 实名认证

内容提供者

专业医药相关文档服务

咨询Ta 进入空间

1亿VIP精品文档

更多 >

11统计模型与统计实验第二篇第四章因变量为0-1的二值回归模型1.pptx