网站大量收购独家精品文档,联系QQ:2885784924

数据分析知识点.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析知识点

一.K.Pearson收集了大量父亲身高与儿子身高的资料。其中十对如下:父亲身高x(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468.370.170求Y关于X的线性回归方程。误差方差的估计例1中误差方差的估计误差方差估计的意义: 误差方差的大小对模型的好坏有很大的影响。自变量对因变量影响的大小是同误差对因变量的影响相比较的。(c)如果自变量对因变量的影响不能显著的超过误差对因变量的影响,就很难从这样的模型中提炼出有效的、有足够精度的信息。显著性检验检验例1中回归效果是否显著,取α=0.05。采用最小二乘法估计参数a和b,并不需要事先知道Y与X之间一定具有相关关系,即使是平面图上一堆完全杂乱无章的散点,也可以用公式求出回归方程。因此μ(x)是否为x的线性函数,一要根据专业知识和实践来判断,二要根据实际观察得到的数据用假设检验方法来判断。若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明Y与X不是线性关系,回归方程无意义。合金钢的强度y与钢材中碳的含量x有密切关系。为了冶炼出符合要求强度的钢常常通过控制钢水中的碳含量来达到目的,为此需要了解y与x之间的关系。其中x:碳含量(%) y:钢的强度(kg/mm2)数据见下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0(1)画出散点图;(2)设μ(x)=a+bx,求a,b的估计;(3)求误差方差的估计,画出残差图;(4)检验回归系数b是否为零(取α=0.05);(5)求回归系数b的95%置信区间;(6)求在x=0.06点,回归函数的点估计和95%置信区间;(7)求在x=0.06点,Y的点预测和95%区间预测。 (1)合金钢的强度y与钢材中碳的含量x的散点图合金钢的强度y与钢材中碳的含量x的回归直线图三.某公司在各地区销售一种特殊的化妆品。该公司观测了15个城市在某季度内对该化妆品的销售量Y及各地区适合使用该化妆品的人数x1和人均收入x2,得到数据如下表所示。假设误差服从正态分布,试建立x1和x2,与y之间的线性回归方程并研究相应的统计推断问题。地区销售(箱)人口(千人)人均收入(元)i?yixi1Xi2116227424502120180325432233753802413120528385678623476169265378278198300881923302450911619521371055532560112524304020122323724427131442362660141031572088152123702605我们可根据SAS运算结果得到下表:方差来源自由度平方和(SS)均方(MS)F值P值回归(R)253844.7164326922.358225679.4660.0001误差(E)1256.883574.74030总和(T)1453901.60000由上表我们可以得到 的估计值检验假设:的统计量 的 检验的p值为(在SAS系统中,若检验p值小于或等于0.0001,则均输出为0.0001 )。这表明y与x1,x2的线性回归关系是高度显著的。参数估计的有关结果参数参数估计标准差t值p值B03.4526132.430650491.4200.1809B10.4960050.0060544481.9240.0001B20.0091990.000968119.5020.0001可以看到,化妆品销售量与适合于使用该化妆品的人数及人均收入之间有显著的线性关系,且x1和x2均是很重要的自变量,并且回归方程为一般的检验步骤1.拟合全模型得残差平方和 SSE(F);2.在H0下,拟合相应的约简模型得残差平方和SSE(R);3.分别计算SSE(F)和SSE(R)的自由度;4.计算检验统计量的观测值及检验P值,并与给定的显著水平做比较。

文档评论(0)

gangshou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档