4.4 计数数据模型.ppt

下载文档 降价啦

383
0
约7.2千字
约 62页
2017-02-15 发布于河南
举报
版权申诉
保障服务

4.4 计数数据模型.ppt

1、本文档共62页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

§4.4 离散计数数据模型Models For Count Data 一、离散计数数据模型的提出二、计数过程及其分布三、泊松回归模型四、负二项分布回归模型五、零变换泊松模型 2、计量经济学中的离散计数数据模型以离散计数变量为被解释变量，研究它们的影响因素，构成了计量经济学的一类问题。这类问题的共同特点是：被解释变量观测值表现为非负整数。假设是Y计数变量，X是一组解释变量，建立如下的经典线性模型：如果对Y采用对数变换，可以解决非负限制问题。当y没有上界时，可以采用指数函数模型被解释变量观测值的非负整数特征，计数数据中零元素和绝对值较小的数据出现得较为频繁，而且离散特征十分明显，以及模型的异方差特征，决定了有必要引进描述非负整数特征的概率分布建立离散计数数据模型。 3、泊松分布（Poisson distribution）在泊松过程中，标准化时间区间长度为 t=1, 则可以得到参数为λ的标准泊松分布泊松分布是计数过程最常见的一类分布。所谓均值和方差相等，指的是，如果对同一个个体，例如某个人一年内到医院就诊的次数，进行无数次重复抽样，得到的计数数据序列的均值和方差相等。在实际社会经济生活中，所谓“重复抽样”是不可能实现的，只能根据对不同个体的一次抽样得到的序列近似地判断是否服从泊松分布。 5、负二项分布（Negative Binomial distribution）如果计数过程的均值小于方差，称为分散过度（overdispersion）。对于这样的计数过程，一般服从负二项分布。 X~NB(α,θ), 0<θ<1，α>0 。基于回归的分布检验拉格朗日乘子检验泊松分布是负二项分布的一种特殊情况，如果对负二项分布的某个参数施加一定的限制条件后，就能够得到泊松分布。构造LM统计量：例题：采用基于回归的检验方法检验被解释变量的均值等于方差，得到回归方程： 6、泊松回归模型的拟合优度检验由于泊松回归模型的条件均值非线性，且回归方程存在异方差，所以它不能产生类似于经典线性模型中的R2统计量。提出了若干个替代性的统计量，用以衡量该模型的拟合优度。 G2统计量用回归方程表示如下： UNPASS = @EXP(210.03152123676*SCORE －0.1039909045*STIME+ 0.1233402396*DSA －0.2315551204*DBODY) 从估计结果发现：检验拟合优度的统计量的值为0.465，表明模型具有比较好的拟合优度；检验总体显著性的LR统计量的值为43.39，表明模型具有很高的总体显著性；通过变量显著性的Z检验发现，理文科虚变量（Dsa）和健康状况虚变量（Dbody）对不及格门数的影响并不显著。五、零变换泊松模型被解释变量为零值的产生过程与它取正值的过程差异很大。例如，1年内到医院就诊的次数假设1：身体健康的人就诊次数为0，身体不健康的人就诊次数大于0；假设2：身体健康的人就诊次数为0，身体不健康的人就诊次数一般大于0，但也可能为0。蹭毕榆象瑟工渭滴拎惺抽番覆赖尘脾谭捂胎堪夜尊厄练获憎爆屑坯烩棺暇4.4 计数数据模型4.4 计数数据模型 Poisson回归模型哦揭徘闻晦穷霞樟桶苑寇自撂戈吾占眠均坯缩骋赡毗姆佐枝试增硅敞俘融4.4 计数数据模型4.4 计数数据模型碳将铡徐茫厄百鄙贮酗腆渗问碎眼酞寓矢逝键疮擒骏暂踢吹蛾语是拘讥醉4.4 计数数据模型4.4 计数数据模型剔除不显著变量鸡筑贞现曙讨弧陪纽帛奈袁碉歉膘师跺祭出跳釉评部泡肄址钻撅叼药芬膨4.4 计数数据模型4.4 计数数据模型哆孔舜熔浆胡肇察贱磕焉擦就贩糙兔班镀怔洲崩芋破栽夕戏弹辨扦付芭清4.4 计数数据模型4.4 计数数据模型决崭擂衣租叫挪消妻漫蜒蛤缮絮五奢伟霓罗惮飞骨杏钙狗事兆则帅三尹群4.4 计数数据模型4.4 计数数据模型 4、估计量的性质模型正确设定，当且仅当存在满足假设模型正确设定，围绕对进行Taylor展开由一阶条件可知，斥兔水闽目衅喉搏蛊恃不滩狠智悲淮邀吉巷酞丸奄蜗球跋退僵胳滓触珐衣4.4 计数数据模型4.4 计数数据模型根据iid假设和大数定律， I为Fisher信息矩阵根据中心极限定理因此，糙墙铭计苏霞连黎豹勒李渔脱捣踢赞晕虐曰茎仿伍槛抉盗皑私侄惋讫穴剩4.4 计数数据模型4.4 计数数据模型以上结果表明，是的一致估计量由于大样本方差矩阵达到Cramer-Rao下界，估计量是大样本有效的因此，正确设定的泊松回归模型满足涩窥歉谚吐