大数据计量经济分析 课件 第7章 计数模型.pptx

大数据计量经济分析 课件 第7章 计数模型.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第7章计数模型1

第7章计数模型本章主要内容泊松回归模型负二项回归模型零膨胀回归模型计数模型综合示例大数据计量分析案例——在线评论有用性的影响因素分析2

7.1泊松回归模型3

7.1.1泊松回归模型在计量分析建模的过程中,有些因变量只能取非负整数,即0,1,2,…,比如,病人看病的次数、企业申请专利的个数、获得的投票个数等。对于这一类计数数据,常使用“泊松回归”(Poissonregression)。对个体i,记因变量为,假设观察值来自参数为的泊松分布:其中,为“泊松分布到达率”,表示事件发生的平均次数,由自变量所决定。4

7.1.1泊松回归模型泊松分布的重要性质是泊松分布的均值和方差都等于泊松分布到达率,即:为了保证非负,假设的条件期望函数为:样本的似然函数为:通过极大似然法(MLE)可得5

67.1.1泊松回归模型泊松回归的Stata命令为:.poissonyx1x2x3,rirr.poissonyx1x2x3,rexposure(x1).poissonyx1x2x3,roffset(x1)其中,选项“r”表示使用稳健标准差;选项“irr”表示显示发生率比;选项“exposure(x1)”表示把ln(x1)作为自变量,并令其系数为1;选项“offset(x1)”表示把x1作为自变量,并令其系数为1。

7.1.2泊松回归模型示例本例选取的数据集为轰炸机打击及破坏目标个数数据集。因变量y为轰炸机所打击并破坏的目标个数,为虚拟变量,表示轰炸机类型,A-4轰炸机为0,而A-6轰炸机为1;为炸弹负重;为机组人员飞行经验积累的总月数,详细数据集如表7-1所示:7

7.1.2泊松回归模型示例8

7.1.2泊松回归模型示例9.summarizey.tabyy的均值为1.533,方差为3.154(即1.7762),方差与均值较为接近,因而考虑选择用泊松回归模型进行分析。

7.1.2泊松回归模型示例10.poissonyx1x2x3,r由估计结果可以看出,自变量和的系数不显著,而x2的系数在5%的显著性水平下显著。准R^2为0.269,模型拟合效果较好。针对x1进行分析,其为虚拟变量,而A-6轰炸机从机型上大于A-4轰炸机,故炸弹载重量应大于A-4轰炸机,同时会携带更多机乘人员,与x2,x3有较强的多重共线性。

7.1.2泊松回归模型示例11.corrx1x2x3x1与x2的相关系数为0.71。利用逐步回归法筛选变量,最终选取单变量x2进行回归。

7.1.2泊松回归模型示例12.poissonyx2,r从估计结果可以看出,尽管模型的拟合优度略有下降(准R^2为0.229),但自变量x2的系数显著。进一步分析有,炸弹负重,即x2每增加一个单位,轰炸机所破坏的目标个数的均值为原来的倍。

7.2负二项回归模型13

7.2.1负二项回归模型如果因变量的方差明显大于均值,即存在“过度分散”,而如果因变量的方差明显小于均值,则存在“散布不足”。当存在过度分散情形时,在条件期望函数的对数表达式中加入一项,即:其中,随机变量表示条件期望函数中的不可观测部分或个体的异质性,则:假设,,则可证明服从负二项分布,然后进行MLE估计,这称为“负二项回归”(Negativebinomialregression)。14

157.2.1负二项回归模型负二项分布的概率密度函数为:负二项回归模型的条件期望和条件方差分别为:α为“过度分散参数”。

7.2.1负二项回归模型负二项回归的Stata命令为:.nbregyx1x2x3,rexposure(x1).nbregyx1x2x3,roffset(x1)其中,选项“r”表示使用稳健标准差;选项“exposure(x1)”表示把ln(x1)作为自变量,并令其系数为1;选项“offset(x1)”表示把x1作为自变量,并令其系数为1。16

7.2.2负二项回归模型示例本例选取的是学生缺勤情况的数据集,该数据集中包含以下变量:daysabs(学生缺勤天数),math(学生的数学成绩)和虚拟变量prog(学生参与的培养项目,取值为1,2和3),共314个样本。部分数据如表7-2所示。17idmathdaysabsprog10016432100227421003202210041632………

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档