- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 简单线性回归
第十一章;双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1), (X2,Y2), …, (Xn,Yn)
目的:研究X和Y的数量关系
方法:回归与相关
简单、基本——直线回归、直线相关; ; 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:
即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”。; 目前,“回归”已成为表示变量之间某种数量依存关系的统计学术语,并且衍生出“回归方程”、“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。;第一节 简单线性回归; 例11-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表11-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。
; 表11-1 8名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h) ;图11-1 8名儿童的年龄与其尿肌酐含量散点图; 在定量描述儿童年龄与其尿肌酐含量数量上的依存关系时,将年龄称为自变量(independent variable),用 X 表示;尿肌酐含量称为应变量(dependent variable),用 Y 表示。
; 由图11-1可见,尿肌酐含量 Y 随年龄 X 增加而增大且呈直线趋势,但并非8个点恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,以区别严格意义的直线方程。
双变量直线回归是回归分析中最基本、最简单的一种,故又称简单回归。;直线回归方程的一般表达式为 ;1.a 为回归直线在 Y 轴上的截距。;b0,直线从左下方走向右上方,Y 随 X 增大而增大;
b0,直线从左上方走向右下方,Y 随 X 增大而减小;
b=0,表示直线与 X 轴平行,X 与Y 无直线关系。; ;二、回归参数的估计 ; ;; 例11-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表11-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。
; 表11-1 8名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h) ;解题步骤;;5.列出回归方程; 此直线必然通过点( , )且与纵坐标轴相交于截距 a 。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的 X 值代入回归方程得到一个点的坐标,连接此点与点( , )也可绘出回归直线。 ;图11-1 8名儿童的年龄与其尿肌酐含量散点图;三、回归模型及参数的统计推断;图11-3 总体回归系数与样本回归系数示意图;;(一)回归方程的假设检验 ;1.方差分析 ;(X,Y);;上式用符号表示为 ;;;上述三个平方和,各有其相应的自由度 ,并有如下的关系: ; 如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量 F
;式中
;2. t 检验;例11-2 检验例11-1数据得到的直线回归方程是否成立? ;(1)方差分析; 表11-2 方差分析表 ;(2)t 检验;注意:;(二)总体回归系数 的可信区间; 例11-3 根据例11-1中所得b=0.1392,估计其总体回归系数的双侧95%可信区间。
;(0.1392-2.447×0.0304,0.1392+2.447×0.0304)
=(0.0648,0.2136);第二节 线性回归的应用;;(11-20) ;2、个体Y值的容许区间;两条实曲线——总体均数的可信区间;
两条虚曲线——个体Y值的容许区间,范围更宽。
二者都是中间窄,两头宽;都在X= 处最窄。
; 例11-4 用例11-1所得直线回归方程,计算当X0=12时, 的95%可信区间和相应个体值的95%容许区间。
;计算步骤;;第三节 残差分析* ;线性回归模型成立的前提条件:
线性(line)— 散点图/残差图
独立(independence) — 专业知识
正态(normal) — 残差的直方图/正态概率图
等方差(equal variance) —散点图/残差图;残差图;
若模回归型选择的正确,残差图中的点应该分布在以0轴为中心的带形区域;
对于远离0轴的点,要特别注意。;第四节 回归分析应用的注意事
您可能关注的文档
最近下载
- 小学数学教学中学生逻辑推理能力的培养策略教学研究课题报告.docx
- [浙江]永康市委统战部编制外工作人员招聘笔试历年参考题库附带答案详解.doc VIP
- 教你三步查看老婆微信聊天记录.docx VIP
- 2022年公务员考试内蒙古行政职业能力测验真题.doc VIP
- 兴澄特钢海洋工程用钢研究与开发现状..ppt VIP
- 运动解剖学课件.pptx VIP
- 2025年气瓶检验员考试题及答案.docx VIP
- 大学藏文四级考试题库及答案.doc VIP
- (2025秋新版)人教版三年级数学上册全册教案.pdf
- 新解读《GB_T 20970-2015石油天然气工业 井下工具 封隔器和桥塞》最新解读.docx VIP
文档评论(0)