- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
§9.3因变量是定性变量的回归模型二、定性因变量回归的特殊问题1.离散非正态误差项。对一个取值为0和1的因变量,误差项εi=yi-(β0+β1xi)只能取两个值:当yi=1时,εi=1-β0-β1xi=πi当yi=0时,εi=-β0-β1xi=1-πi显然,误差项εi是两点型离散分布,当然正态误差回归模型的假定就不适用了。第29页,共61页,星期日,2025年,2月5日§9.3因变量是定性变量的回归模型2.零均值异方差性。当因变量是定性变量时,误差项εi仍然保持零均值,这时出现的另一个问题是误差项εi的方差不相等。0-1型随机变量εi的方差为D(εi)=D(yi)=πi(1-πi)=(β0+β1xi)(1-β0-β1xi)(9.14)εi的方差依赖于xi,是异方差,不满足线性回归方程的基本假定。第30页,共61页,星期日,2025年,2月5日§9.3因变量是定性变量的回归模型3.回归方程的限制当因变量为0、1虚拟变量时,回归方程代表概率分布,所以因变量均值受到如下限制:θ≤E(yi)=πi≤1对一般的回归方程本身并不具有这种限制,线性回归方程yi=β0+β1xi将会超出这个限制范围。第31页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型一、分组数据的Logistic回归模型针对0-1型因变量产生的问题,我们对回归模型应该做两个方面的改进。第一,回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用直线回归方程。第32页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型限制在[0,1]区间内的连续曲线有很多,例如所有连续型随机变量的分布函数都符合要求,我们常用的是Logistic函数与正态分布函数。Logistic函数的形式为Logistic函数的中文名称是逻辑斯谛函数,或简称逻辑函数。第33页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型第二,因变量yi本身只取0、1两个离散值,不适于直接作为回归模型中的因变量。由于回归函数E(yi)=πi=β0+β1xi表示在自变量为xi的条件下yi的平均值,而yi是0-1型随机变量,因而E(yi)=πi就是在自变量为xi的条件下yi等于1的比例。这提示我们可以用yi等于1的比例代替yi本身作为因变量。下面通过一个例子来说明Logistic回归模型的应用。第34页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型例9.4在一次住房展销会上,与房地产商签定初步购房意向书的共有n=325名顾客中,在随后的3个月的时间内,只有一部分顾客确实购买了房屋。购买了房屋的顾客记为1,没有购买房屋的顾客记为0。以顾客的年家庭收入(万元)为自变量x,对如下的数据,建立Logistic回归模型第35页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型第36页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型Logistic回归方程为其中c为分组数据的组数,本例c=9。做线性化变换,直接在Transform-ComputeVariable中进行,令上式的变换称为逻辑(Logit)变换,得pi′=β0+β1xi+εi (9.16)(9.18)(9.17)第37页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型在线性回归对话框中,注意变量名和意义。计算出经验回归方程为-0.886+0.156x (9.19)判定系数r2=0.9243,显著性检验P值≈0,高度显著。还原为(9.16)式的Logistic回归方程为利用(9.20)式可以对购房比例做预测,例如对x0=8,第38页,共61页,星期日,2025年,2月5日§9.4Logistic回归模型我们用Logistic回归模型成功地拟合了因变量为定性变量的回归模型,但是仍然存在一个不足之处,就是异方差性并没有解决,(9.18)式的回归模型不是等方差的,应该对(9.18)式用加权最小二乘估计。当ni较大时,pi′的近似方差为:其中πi=E(yi),因而选取权数为:wi=nipi(1-pi)第39页,共61页,星期日,2025年,2月5日
原创力文档


文档评论(0)