- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文科统计与概率1-回归分析文科统计与概率1-回归分析
文科统计与概率1-回归分析
一、回归分析
1、函数关系
函数关系是一种确定性的关系,如一次函数,二次函数
2、相关关系
变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系带有随机性
3、散点图
把两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图,通过散点图可以初步判断两个变量之间是否具有相关关系。
(1)正相关 散点图中,点分布在左下角到右上角的区域
(2)负相关 散点图中,点分布在坐上角到右下角的区域
4、回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
5、求回归直线方程的一般步骤:
?作出散点图→?由样本点是否呈条状分布来判断两个量是否具有线性相关关系(粗略)或者计算相关系数( 越接近于1,两个变量的线性相关性越强),若存在线性相关关系→?求回归系数 →④写出回归直线方程 ,并利用回归直线方程进行预测说明.6、线性回归方程: 其中,
注意:?线性回归直线经过定点,点称为样本点的中心。?最小二乘法是使得样本数据的点到回归直线的距离的平方和最小的方法,以上公式是和的值的最好估计?是斜率的估计值,若0,每增加一个单位,的值就增加;若0,每增加一个单位,的值就减少||
7、相关系数(判定两个变量线性相关性):
注:⑴0时,变量正相关;此时相当于回归直线方程中的斜率为正
0时,变量负相关;此时相当于回归直线方程中的斜率为负
⑵① 越接近于1,两个变量的线性相关性越强;
② 接近于0时,两个变量之间几乎不存在线性相关关系。
?通常当时,认为两个变量有很强的线性相关关系。如果两个变量不具有线性相关关系,即使求出回归方程也毫无意义,用其进行预测也是不可信的。
8、回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
9、回归方程拟合效果分析
评价回归效果的三个统计量:总偏差平方和(总的效应);残差平方和(随机误差的效应);回归平方和(解释变量的效应).
(1)计算每组观测数据残差,列出样本编号与对应残差
(2)选样本编号为横坐标,残差为纵坐标,作出的图形称为残差图
(3)分析残差图。残差点比较均匀落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。(每一个残差的绝对值越小,带状区域宽度越窄,拟合效果越好)
(4)可根据残差图,查找异常样本数据
(5)计算残差的平方和,残差平方和越小,拟合效果越好。
(6)计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)
10、非线性回归问题
非线性回归问题有时并不给出经验公式,此时可画出已知数据的散点图,把它与以前学过的各种函数(幂函数、指数函数、对数函数等)图像做比较,挑选一种跟这些散点图拟合得最好的函数,然后采用适当的变量置换,把问题转化为线性回归分析问题,使之得到解决。
11、两种非线性回归方程拟合效果的比较(高中阶段不涉及)
(1)对于给定的样本点,明确哪个变量是解释变量x,哪个是预报变量y,画出散点图后,根据已知的函数知识,分别建立两个回归方程。
(2)若为非线性回归方程,可通过适当的变量置换,转化为线性回归方程
非线性回归问题的处理方法:
指数函数型
① 函数的图像:
② 处理方法:两边取对数得,即.令把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出.
对数曲线型
① 函数的图像
② 处理方法:设,原方程可化为
再根据线性回归模型的方法求出.
二次函数型
处理方法:设,原方程可化为,再根据线性回归模型的方法求出.
(3)按一定规则估计回归方程中的参数(如最小二乘法),求得线性回归方程后可再转化为原来的非线性回归方程
(4)分析拟合效果。分别计算残差,列表比较,残差的绝对值越小,拟合效果越好。
(5)一般情况下,比较两个模型的残差比较困难,原因是某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反。此时需计算残差的平方和,残差平方和越小,拟合效果越好。
(6)也可计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)
二、历年高考试题汇编
(2012年文科新课标卷)3、在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为
(A)-1 (B)0 (C)12
文档评论(0)