- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文科统计与概率1回归分析
文科统计与概率1-回归分析
一、回归分析
1、函数关系
函数关系是一种确定性的关系,如一次函数,二次函数
2、相关关系
变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系带有随机性
散点图
把两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图,通过散点图可以初步判断两个变量之间是否具有相关关系。
正相关 散点图中,点分布在左下角到右上角的区域
负相关 散点图中,点分布在坐上角到右下角的区域
4、回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
5、求回归直线方程的一般步骤:
(作出散点图→(由样本点是否呈条状分布来判断两个量是否具有线性相关关系(粗略)或者计算相关系数( 越接近于1,两个变量的线性相关性越强线性回归方程:其中, 注意:(线性回归直线经过定点称为样本点的中心。(最小二乘法是使得样本数据的点到回归直线的距离的平方和最小的方法,以上公式是和的值的最好估计(是斜率的估计值,若0,每增加一个单位,的值就增加;若0,每增加一个单位,的值就减少||
7、相关系数(判定两个变量线性相关性):
注:⑴0时,变量正相关;
0时,变量负相关;
⑵① 越接近于1,两个变量的线性相关性越强;
② 接近于0时,两个变量之间几乎不存在线性相关关系。
回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
回归方程拟合效果分析
评价回归效果的三个统计量:总偏差平方和(总的效应);残差平方和(随机误差的效应);回归平方和(解释变量的效应).
计算每组观测数据残差,列出样本编号与对应残差
选样本编号为横坐标,残差为纵坐标,作出的图形称为残差图
分析残差图。残差点比较均匀落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。(每一个残差的绝对值越小,带状区域宽度越窄,拟合效果越好)
可根据残差图,查找异常样本数据
计算残差的平方和,残差平方和越小,拟合效果越好。
计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)
非线性回归问题
非线性回归问题有时并不给出经验公式,此时可画出已知数据的散点图,把它与以前学过的各种函数(幂函数、指数函数、对数函数等)图像做比较,挑选一种跟这些散点图拟合得最好的函数,然后采用适当的变量置换,把问题转化为线性回归分析问题,使之得到解决。
两种非线性回归方程拟合效果的比较(高中阶段不涉及)
对于给定的样本点,明确哪个变量是解释变量x,哪个是预报变量y,画出散点图后,根据已知的函数知识,分别建立两个回归方程。
(2)若为非线性回归方程,可通过适当的变量置换,转化为线性回归方程
非线性回归问题的处理方法:
指数函数型
① 函数的图像:
② 处理方法:两边取对数得,即.令把原始数据(x,y)x,z),再根据线性回归模型的方法求出.
对数曲线型
① 函数的图像
② 处理方法:设,原方程可化为
再根据线性回归模型的方法求出.
二次函数型
处理方法:设,原方程可化为,再根据线性回归模型的方法求出.
(3)按一定规则估计回归方程中的参数(如最小二乘法),求得线性回归方程后可再转化为原来的非线性回归方程
(4)分析拟合效果。分别计算残差,列表比较,残差的绝对值越小,拟合效果越好。
(5)一般情况下,比较两个模型的残差比较困难,原因是某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反。此时需计算残差的平方和,残差平方和越小,拟合效果越好。
(6)也可计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)
二、历年高考试题汇编
(2012年文科新课标卷)3、在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为
(A)-1 (B)0 (C) (D)1
(2009年文科新课标卷)3.对变量有观测数据(,)(),得散点图1;对变量有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
(2015年文科新课标2卷)3.根据下面给出的20
您可能关注的文档
- 数列大题第一问.doc
- 教师版:2009年高考试题解析数学(理科)学科新课标分项版之专题九__立体几何.doc
- 数列末测试题.doc
- 数列的通项公式与数列求和.doc
- 数图实验题.doc
- 数列通项公式的求法(经典).doc
- 教案B1U2Langaugepoints.doc
- 数字图像处理试卷12131A(含草稿纸).doc
- 数字电子技术复习指导20150608.doc
- 教育理论综合知识模拟测试题答案.doc
- 文言文检测题2011721.doc
- 断层组合及解释.doc
- 新(多重共线性).ppt
- 新1415六年级英语期中检测试题.doc
- 新B4M5languagepoints导学案.doc
- 新人教版必修一Unit4EarthquakesImportantLanguagePoints[优秀教案].doc
- 新人教版必修一Unit5NelsonMandelaImportantLanguagePoints[优秀教案].doc
- 新北师大版八年级数学下册第一章《三角形的证明》测试卷.doc
- 新华教育高中部数学同步人教A版必修四第一章三角函数三角函数的图象与性质学习过程.doc
- 新动力SkillSoft在线培训课程目录V20.doc
文档评论(0)