回归分析作业3范本.doc

姓名: 学号: 作业三 1、假设我们得到一个抽样调查数据,得到一个回归分析结果如下,根据下列表格,回答问题 。 表3 影响受教育年数的OLS多元回归分析模型 回归系数 B 标准化回归系数 Beta 显著度 Sig 容忍度 Tolerance 性别 -.054 -.007 .856 .966 年龄 -.123 -.426 .000 .961 居住地(参照类为农村) 城镇 1.272 .092 024 .802 城市 1.629 .193 .000 .789 家庭年收入(参照类为中低收入) 低收入 -1.019 -.496 .036 .037 中等收入 1.314 .134 .067 .089 高收入 2.784 .271 .051 .095 确定系数R2::0.362 调整后的确定数(Adjusted R2):0.353 回归方程F值:45.547*** Durbin-Watson:1.961 残差均值Residual Mean:0.000 1、根据什么指标来判断模型整体解释力?模型整体解释力如何? 答:根据调整后的确定系数(Adjusted R2)判断模型整体解释力。 性别、年龄、居住地和家庭年收入这4个自变量能够解释因变量(受教育年数)总方差的35.3%,模型整体解释力较弱。 2、居住地对因变量的作用是什么? 答:在95%的置信水平下,在控制了其他变量的情况下,居住地与受教育年数存在显著的线性相关关系(p0.05)。城镇居民的受教育年数比居住在农村的人多1.272年,城市居民的受教育年数比居住在农村的人多1.629年。 3、家庭年收入多分类的自变量在回归方程中,只要有一类是显著的,就可以说这个自变量对因变量有显著的影响。对因变量的作用是什么下结论之前先看多重共线性的诊断结果Tolerance是否小于0.1,如果是,就要先说明出现了多重共线性,需要去掉该变量,如果不是,再开始做是否有作用的解读:可以这样写家庭年收入对受教育年数有显著的影响,低收入者的受教育年数比中低收入者少1.019年,而中等收入、高收入者与中低收入者在受教育年数上没有显著的差别。? 多分类的自变量在回归方程中,只要有一类是显著的,就可以说这个自变量对因变量有显著的影响。 下结论之前先看多重共线性的诊断结果Tolerance是否小于0.1,如果是,就要先说明出现了多重共线性,需要去掉该变量,如果不是,再开始做是否有作用的解读:可以这样写 家庭年收入对受教育年数有显著的影响,低收入者的受教育年数比中低收入者少1.019年,而中等收入、高收入者与中低收入者在受教育年数上没有显著的差别。 答:在95%的置信水平下,在控制了其他变量的情况下,家庭收入与模型中其他自变量出现了多重共线性(容忍度0.1),为此应该将此变量删除。 4、哪一个自变量对因变量的相对作用更大?为什么? 答:年龄。依据标准化回归系数来判断对因变量相对作用最大的自变量,虽然家庭收入的标准化回归系数最大,但是该变量的多重共线性诊断的结果表明出现了模型不能容忍的多重共线性问题(容忍度0.1),家庭收入能够被其他自变量进行线性表达,应该被删去,在剩余的有显著影响的自变量中,年龄的标准化回归系数的绝对值最大。 5、Durbin-Watson指标说明了什么? 答:Durbin-Watson指标的值为1.961,处于2附近,说明当自变量取任意不同值时,其误差项之间独立。 2、请根据任意数据库(公开发表的,或者老师布置的练习库) ,选择你感兴趣的变量,做多元线性回归分析,并进行描述, 要求: 写明理论假设,指明因变量和自变量 自变量中至少一个定距/定比变量,至少有一个虚拟变量 至少找出两个对因变量有显著线性影响的自变量 检验多重共线性 使用残差分析,并解释残差分析的结果 分别解释自变量对因变量的作用 解释回归模型的整体解释力 【答】 首先确定研究目标,即利用已有数据库资料建立一个关于2006年居民总收入(因变量)影响因素的模型。将可能的自变量分成三组,第一组是人口学变量,包括性别、年龄、受教育年数、家里几口人住在一起并且一起吃饭等;第二组是根据常识判定、得到普遍认可的和收入有关的变量,包括家庭中几人有收入、投资方式、工作状态、职业、获得固定收入多少、投资收益多少、其他所得多少等;第三组是学生有意研究的变量,包括心情愉悦程度、生长环境和户口类型。这一段非常好,尝试着写出有争论性的理论假设, 这一段非常好,尝试着写出有争论性的理论假设,而且给自变量做了分组。值得大家借鉴。 其中,定距/定比自变量有年龄、受教育年数、家里几口人、几人有收入、获得固定收入多少、获得投资收益多少

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档