数模作业05.docVIP

  • 1
  • 0
  • 约1.88千字
  • 约 5页
  • 2018-11-24 发布于河南
  • 举报
数模作业05

姓名:李哲 学号:1200900523 6章案例 (a) 变量描述: EARN(千美元)――营业利润; SIZE(平方米)――快餐店大小; EMPL(个)――员工数目 P15(个)――方圆3公里内15-24岁人口数目; P25(个)――方圆3公里内25-34岁人口数目; P35(个)――方圆3公里内35-44岁人口数目; P45(个)――方圆3公里内45-54岁人口数目; P55(个)――方圆3公里内55岁以上人口数目; total(个)――方圆3公里内总人口数目; INC(千美元)――快餐店附近地区平均收入; COMP(个)――附近直接竞争对手数目; NCOMP(个)――附近非直接竞争对手数目; NREST(个)――附近非餐饮商店的数目; PRICE()――每月租房的每平方米价格; CLI()――生活费用指数; K(千美元)――投资于快餐店的资本。(未在模型中) 60家的模型如下(标记为图1): 首先,检查回归系数是否具有直观的含义。 SIZE:系数为0.771,快餐店越大,利润越高是合理的; EMPL:系数为-0.866,职员越多,利润越低是合理的; total:系数为-0.010,周围人口数越多,利润越低是不合理的。因此这个系数可以考虑去除; P15、P25、P35、P45、P55:均为正系数,人口越多,利润越高是合理的; INC:系数为8.763,平均收入越高,利润越高是合理的; COMP:系数为-2.681,竞争对手越多,利润越低是合理的; NCOMP:系数为-0.347, 非直接竞争对手越多,利润越低不明确,无法判断; NREST:系数为1.451,非餐饮项目越多,利润越高是合理的; PRICE:系数为-3.173,房价越高,利润越低是合理的; 10. CLI:系数为0.402,生活指数越高,利润越高是合理的。 其次,利用t统计值检查回归系数是否显著不为0。 在95%的置信水平上,当自由度dof=60-14-1=45时,计算其显著性检验的c值。由于dof=45,大于30,因此其c=1.96。 只有当t的绝对值大于c时,才能说明该变量回归系数是显著不为0。 对照后我们发现,EMPL、total、P25、P35、P45、P55、COMP、NCOMP、CLI这些变量回归系数均显著为0,因此可以考虑予以消去。 第三,检查R SQUARE是否是一个较高的值。 在这里,R SQUARE为0.867,是比较好的高值。 第四,检查正态性、异方差性、自相关性。 回归残差值的直方图表明具有正态性; 每个自变量的散点图表明不具有异方差性; 残差的时序散点图表明不存在自相关性。 第五,检查多重共线性。 下表是各变量的相关系数输出结果: 从表中可以看出: total、P15、P25、P35、P45、P55存在多重共线性,对比回归系数显著不为0的检查,因此可以只用P15即可,其他可以去除; 通过比较PRICE与EARN的相关系数,我们发现其相关系数很小,即其相关性很低,也可以考虑去除。 通过以上,新模型的自变量减少为:SIZE、P15、INC和NREST。重新构造回归模型后,结果如下: 重新检查回归系数的直观含义、t统计值检查回归系数显著不为0的情况、R SQUARE、正态性、异方差性、自相关性、多重共线性,可以看出这是一个较好的模型。 (b)解: 前50家快餐店的数据构造的回归模型如下: 通过上面的模型进行的51-60的预测值以及业绩比率是否达到要求的情况表如下: (c)解: 简化后的60家模型见图2,即, 通过上面的模型进行的1996年新开的10家店选地址的预测情况以及预测业绩比率是否达到要求的情况表如下: 通过上表,可以看出只有Toulouse达到了26%的目标要求,而Dijon接近26%的目标。 (d)解: 从(a)、(b)、(c)的分析可以看出,简化后的回归模型还是具有相当的参考性的,因为从检查回归系数的直观含义、t统计值检查回归系数显著不为0的情况、R SQUARE、正态性、异方差性、自相关性、多重共线性的情况看,均满足一个较好的回归模型的要求。在(b)中预测的准确率达到了90%,从而为在(c)中预测1996年新开店的选地址提供一个很好的参考基础。 这个模型的优点是已经考虑了一些和快餐店直接相关的因素,但可能还需要考虑一些宏观的因素,比如当地经济发展的状况、政府对相关地段的未来规划等,都需要进行考虑,都可能会影响到新开快餐店的选地址问题。 第 5 页 共 5 页

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档