数据分析方法第二版习题二2.4题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.4某公司管理人员为了解某化妆品在一个城市的月销售量Y(单位:箱)与该城市中适合使用该化妆品的人数X1(单位:万人)以及他们人均月收入X2 表2.16 化妆品销售数据 城市 销量(y) 人数( 收入( 1 162 27.4 2450 2 120 18.0 3254 3 223 37.5 3802 4 131 20.5 2838 5 67 8.6 2347 6 169 26.5 3782 7 81 9.8 3008 8 192 33.0 2450 9 116 19.5 2137 10 55 5.3 2560 11 252 43.0 4020 12 232 37.2 4427 13 144 23.6 2660 14 103 15.7 2088 15 212 37.0 2605 假设Y与X1,X y 其中εi( (1)求回归系数β0,β (2)给出方差分析表,解释对线性回归关系显著性检验的结果,求复相关系数的平方R2 (3)分别求β1和β (4)对α=0.05,分别检验人数X1及收入X2对销量Y的影响是否显著,利用与回归系数有关的一般假设检验方法检验X1和 (5)该公司欲在一个适宜使用该化妆品的人数x01=220,人均月收入 (6)求Y的拟合值、残差及学生化残差,根据对学生化残差的正态性的频率检验及正态QQ图检验说明模型误差项的正态性假定是否合理,有序学生化残差与标准正态分布的分位数的相关系数是多少?作出各种残差图,分析模型有关假定的合理性. 公式: 2.1 回归参数β的最小二乘估计 β的最小二乘估计即选择β使误差平方和 S 达到最小,其中xi0=1(i=1,2,…,n),为此将Sβ分别对 ? 即 i 将此方程组写为矩阵形式,即 X 称此方程为正规方程 由于rankXTX=rankX β 进一步,Sβ在β H 为正定矩阵且正规方程的解唯一,故β是Sβ 将β=(β Y 为经验回归方程或简称回归方程,利用回归方程,可由自变量X1,X2,…, 2.2 误差方差σ2 将自变量X1,X2,…,Xp-1的各组观测值( Y 其中H= XXTX-1XT为 ε 其中I为n阶单位矩阵,由于β为正规方程的解,故由?Sβ?βk=-2i=1nyi SSE 称SSE为残差平方和,注意到1-H ε 从而 SSE= 由此可得 E 从而 σ 为σ2 2.3 估计量的基本性质 下面给出β和σ2的三条基本性质,第一条是有关β和σ2的矩性质,第二条是有关二者的分布性质,第三条是有关残差向量 性质1 对于线性回归模型Y=Xβ+ε,β的最小二乘估计β=XTX- E Cov E 性质2 对于线性回归模型Y=Xβ+ε,若ε~N β 1 β与SSE(或σ2 性质3 对于线性回归模型Y=Xβ+ε,若ε~N(0,σ E ε 2.4 离方差平方和的分解与复相关系数 总离方差平方和SST SST 残差平方和(误差平方和)SSE SSE 回归平方和SSR SSR SST、SSE、SSR之间的关系 SST=SSE+SSR 复相关系数R R2 2.5 线性回归关系的显著性检验 构造检验统计量 F 其中 MSR 分别为均方回归和均方残差,p-1称为SSR的自由度,它等于回归模型中自变量的个数,n-p称为SSE的自由度,它等于样本容量n与回归模型中的未知参数个数p之差,进一步称 F 用SAS软件的proc reg过程中,线性关系的显著性检验以如下方差分析表的形式输出,同时输出拟合优度统计量R2 方差分析表 方差来源 自由度 平方和(SS) 均方(MS) F值 P值 回归(R) p SSR MSR F p 误差(E) n-p SSE MSE 总和(T) n SST 2.6 回归系数的统计推断 SAS软件的proc reg过程将参数估计值、标准差估计以及tk观测值和相应检验βk=0(包括k 变量 参数估计值 标准差估计 统计值tk 检验p值 常数项(Intercept) β S( t p X β S( t p ? ? ? ? ? X β S( t p 另一方面,利用tk=βk- β 其中t1-α2(n- 2.7 预测及其统计推断 设x01,x02,…,x0p-1为自变量X1, y y0是y0的一个点估计,但在实际中,更感兴趣的是给出 对于给定的的置信水平α,Y在(x01,x02 y 学生化残差 若假设误差向量ε~ N0,σ ε 其中hii为H的主对角线上的第i个 h 其中xiT=(1,xi1 由εi~N0,σ21-hii可知,V r 残差正态性的频率检验 残差正态性的频率检验是一种很直观的检验方法,其基本思想是将学生化残差落在一些范围内的频率与标准正态分布在相应范围内的概率(或称为理论频率)作比较,若两者差异较大,则认为残差(从而模型的误差项)不服从正态分布,否则无理由拒绝

您可能关注的文档

文档评论(0)

gl5000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档