- 1
- 0
- 约5.87千字
- 约 72页
- 2023-04-28 发布于广东
- 举报
比较T与临界值t(0.005,8),T3.36 从而可以拒绝H0的假定,统计上提供依据可以认为学生人数与披萨店的销售量有显著相关关系。 第三十页,共七十二页,2022年,8月28日 3.F检验及相关抽样分布 F检验是针对整体模型是否显著而设计的假设检验。在一元简单回归模型中,F检验的对象与T检验一致,结果也一致。但在多元回归模型中,F检验是对所有自变量的显著性同时进行检验。 第三十一页,共七十二页,2022年,8月28日 F检验的原理:类似于方差分析的构造方式,总体方差有两个独立的估计量。 之前介绍的MSE是总体方差 的无偏估计, 的另一个独立估计量为MSR MSR=SSR/(k-1) k为模型待估参数个数。 在一元回归模型中,k=2 第三十二页,共七十二页,2022年,8月28日 当H0: 为真时,两个估计量应当相当接近,且MSR和MSE相除后得到的统计量服从F分布,自由度为(k-1,n-2) 我们依照该分布的特点,且在一定显著水平下,找到统计值落入小概率事件的区域。 F=MSR/MSE~F(a;k-1,n-2) 拒绝原则:如果FF临界值,则拒绝H0,从而可以认为模型整体通过显著检验。 第三十三页,共七十二页,2022年,8月28日 类似于方差分析,我们同样可以列出ANOVA表: 方差来源 平方和 自由度 均方(mean square) F统计量 回归方程 SSR k-1 MSR=SSR/(K-1) MSR/MSE 误差 SSE n-2 MSE=SSE/(n-2) 合计 SST n-1 第三十四页,共七十二页,2022年,8月28日 披萨店的例子:k-1=1 由之前的计算,有MSR=14200,MSE=1530/8=191.25 F=14200/191.25=74.25 通过比较F与临界值,有F11.26,相应拒绝H0原假设,认为模型整体通过显著检验。 F检验结果与T检验一致。 第三十五页,共七十二页,2022年,8月28日 对一元线性回归模型而言,F检验与T检验的关系: 第三十六页,共七十二页,2022年,8月28日 4.回归模型中参数的区间估计 样本回归模型中的b1是由(x,y)的一组样本数据计算得到的,类似于点估计, 那么对总体回归模型中的 是未知参数,我们通过样本估计b1来估计,其区间估计为:置信度(1-α) 第三十七页,共七十二页,2022年,8月28日 5.关于显著性检验的几点问题 1. 变量x和y之间有显著性关系,并不能得出x和y之间存在因果关系的结论。我们可以说,x的变化是y产生变化的最大可能。 2. x和y之间存在显著性关系,不能说明x和y之间存在线性关系。只能说明在样本观察值范围内有一近似线性关系。 第三十八页,共七十二页,2022年,8月28日 利用估计回归方程进行估计和预测 前面的章节对模型的拟合度、参数估计显著性进行的分析,在我们得到较高的拟合度以及明显的变量间关系以后,可以利用估计回归方程进行估计和预测。 估计:因变量的点估计和区间估计 预测:观测样本以外的因变量预测 第三十九页,共七十二页,2022年,8月28日 1. E(y)的点估计: 利用估计回归方程给出某一特定的x对应的y的均值的点估计。 由披萨店的例子,我们估计当x=10时的y均值的点估计。 说明:所有位于有1万名学生的校园附近的餐馆平均每季度销售额为11万美元。 第四十页,共七十二页,2022年,8月28日 因为: 是 的无偏估计。 所以给出的是在某个对应点上因变量的均值。 第四十一页,共七十二页,2022年,8月28日 2.E(y)的区间估计 在已知了E(y)点估计 的基础上,我们可以构造E(y)的区间估计:点估计加减抽样极限误差 抽样极限误差与点估计 的标准差有关。 第四十二页,共七十二页,2022年,8月28日 因为: 第四十三页,共七十二页,2022年,8月28日 E(y)的置信区间的估计公式为: 求位于有1万名学生的校园附近的连锁店平均销售收入的95%置信区间: (98585,121415) 第四十四页,共七十二页,2022年,8月28日 由标准差 的公式看出,当 时, 最小,相应的E(y)估计区间最窄。 x y 抽样极限误差 x y 第四十五页,共七十二页,2022年,8月28日 3. y的个别值预测区间 当 时,以 作为 的预测值。 预测误差为: 第四十六页,共七十二页,2022年,8月28日 当总体方差未知时,我们用MSE替代, 由已知抽样分布,有, 第四十七页,共七十二页,2022年,8月
原创力文档

文档评论(0)