- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
12h第十二章 简单回归分析
第12章;本章内容
第一节 简单线性回归
第二节 线性回归的应用
第三节 残差分析
第四节 非线性回归
;双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1), (X2,Y2), …, (Xn,Yn)
目的:研究X和Y的数量关系
方法:回归与相关
简单、基本——直线回归、直线相关; ; 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 。
也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”; “回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”等统计学概念。如研???糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。;线性回归的概念及其统计描述;直线回归的概念 ; 为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表12-1)进行回归分析,得到图12-1所示散点图(scatter plot)
;No.; 在定量描述健康人凝血酶浓度(X)与凝血时间(Y)数据的数量上的依存关系时,将凝血酶浓度称为自变量(independent variable),用 X 表示;凝血时间称为应变量(dependent variable),用 Y 表示;; 由图12-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。
;样本线回归方程;1.a 为回归直线在 Y 轴上的截距;2. b为回归系数,即直线的斜率;回归模型的前提假设; ;;残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。
求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。; ;本例:n=15 ΣX=14.7 ΣX2=14.81 ΣY=224 ΣXY=216.7 ΣY2=3368;;;解题步骤;3、计算有关指标的值
4、计算回归系数和截距
5、列出回归方程; ;总体回归系数β的的统计推断;回归方程的假设检验 ;;;1.方差分析 ;Y的离均差,总变异;数理统计可证明:
;上式用符号表示为 ;;上述三个平方和,各有其相应的自由度 ,并有如下的关系: ; 如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F:
;式中
;t 检验 ; 检验例12-1数据得到的直线回归方程是否成立? ;(1)方差分析; 方差分析表 ;(2)t 检验;注意:;总体回归系数 的可信区间; 本例b=-6.9802, 自由度=13,t0.05,13=2.16,Sb=0.78655, 代入公式(12-7)得参数β的95%置信区间为
=(-8.6791 ~ -5.2813)
;;第二 节 线性回归的应用(估计和预测) ;反映其抽样误差大小的标准误为;例12-1中,第一观测值X1=1.1,
0.4994, 0.404, 代入(12.8)式获得第一观测点X1对应的 的标准误为
0.1599
Y的总体均数的95%置信区间为
14.0957±(2.16)(0.1599)=(13.7502,14.4412) ;实
测
值
;以上是给定某一X值时所对应的总体均数的置信区间。当同时考虑X的所有可能取值时,总体均数的点估计就是根据样本算得的回归直线
(1-α)置信区间的上下限连起来形成一个弧形区带,称为回归直线的(1-α)置信带(confidence band)。同样,因为其标准误是X的函数,所以在均数( )点处置信带宽度最小,越远离该均数点,置信带宽度越大。 ;图12-4中,左图显示位于最小二乘回归线上下两侧的两条弧形虚线为总体回归线的(1-α)置信区带。右图的实线表示可能的总体回归线,它们落在弧形虚线所确定的置信带内。
(1-α)置信
您可能关注的文档
最近下载
- 人乳头瘤病毒感染护理.pptx VIP
- 压疮品管圈成果汇报PPT幻灯片.ppt VIP
- 车险承保方案.pdf VIP
- 中华民族共同体概论教案合集(第一讲-第十六讲)附《中华民族共同体概论》课程大纲.doc VIP
- “中华民族共同体概论”课程教学与建设关键问题探讨.docx VIP
- 诸侯纷争与变法运动【课件】.pptx VIP
- 中国高血压防治指南(2024年修订版)_中国高血压防治指南修订委员会__.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学.pdf VIP
- 民事诉讼法中案外第三人对执行的异议之诉.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学试卷含答案.pdf VIP
文档评论(0)