二值选择模型描述.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
说 明 * 然而这样做是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。 当预测值落在 [0,1] 区间之内 时,则没有什么问题; 但当预测值落在[0,1] 区间之外时,则会暴露出该模型的严重缺点。 因为概率的取值范围是 [0,1],所以此时必须强令预测值(概率值)相应等于0或1 由于线性概率模型的上述缺点,希望能找到一种变换方法, (1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。 (2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。 显然累积概率分布函数F(zi) 能满足这样的要求。 另外logistic函数也能满足这样的要求。 采用累积正态概率分布函数的模型称作Probit模型。 采用logistic函数的模型称作logit模型。 logit累积概率分布函数的斜率在pi = 0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于pi = 0.5附近的解释变量xi的变化对概率的变化影响较大,而相对于pi接近0和1附近的xi值的变化对概率的变化影响较小。 logit曲线计算上也比较方便 logit模型的一个重要优点是把在 [0,1] 区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。 在样本中pi是观测不到的。相对于xi的值,只能得到因变量yi取值为0或1的信息。极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的 的估计值。从样本看,如果第一种选择发生了n次,第二种选择发生了N-n次。设采取第一种选择的概率是pi。采取第二种选择的概率是(1- pi)。重新将样本数据排列,使前n个观测值为第一种选择,后N-n个观测值为第二种选择(观测值是0,1的,但相应估计的概率却各不相同),则似然函数是 核心概念 一 *

文档评论(0)

w6633328 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档