- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
_研用-09回归
一九九九年五月 第九章 直线相关与回归 杨丽-- 第九章 直线相关与回归 第九章双变量回归与相关 研究两个数值变量间的数量关系 第一节直线回归 第二节直线相关 第三节秩相关 第四节加权直线回归 第五节两条回归直线的比较 SPSS过程 练习题 主讲人:暨南大学医学院医学统计学教研室 杨丽 yangli810@163.com 医学院大楼 834 第一节 直线回归 linear regression 回归概念 散点的趋势 直线回归方程的求导 统计推断 估计与预测 1 、例9-1 P182~184 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)。估计尿肌酐含量(Y)对其年龄(X)的回归方程。 根据变量间的关系,确定自变量和因变量。 年龄X为自变量,independent variable; 尿肌酐含量Y为因变量,dependent variable。 绘制散点图,观察点子的走向。 求导直线回归方程,并进行检验。 2、观察散点的分布趋势 以横轴为年龄X,纵轴为尿肌酐Y,将随机样本的n对变量值(X1,Y1),…,( Xn,Yn),即(13,3.54),(11,3.01),…,(7,2.65)(表9-1数据,共8记录),绘于图中,得散点图。 若有直线趋势,可进行线性回归或相关分析。 尿肌酐含量Y 随年龄X增加而增大,且呈直线趋势。 异常点,outlier。 明显远离主体的数据。 3 、概念 回归(regression)分析 事物或现象间的数量依存关系。 直线回归,linear regression。 简单回归,simple regression。 两连续性变量X与Y之间的线性数量依存关系。 X为自变量,independent variable; Y为因变量,dependent variable。 回归关系是数量关系,不是一一对应的函数关系。 年龄和身高的关系。 主要任务:找出最适合的直线回归方程。 按某种要求,导出最接近实测点的直线。 4、直线回归方程? 直线回归方程,linear regression equation。 a为常数项;b为回归系数; ^Y为X值处Y的总体均数mY|X的一样本估计值。 回归方程的预测值,predicted value。 对于X各取值,相应Y的总体均数mY|X在一直线上。 假定每个对应的总体为正态分布,各总体分布的总体方差相等且各观测相互独立。 4.1 常数项a,constant term 截距,intercept,回归直线在Y轴的交点。 a = 0,交点在原点上; a 0,交点在原点的上方; a 0,交点在原点的下方。 统计意义:当X=0时,相应Y的均数估计值。 4.2 回归系数b, Coefficient of regression 斜率,slope。 直线越陡,斜率b = tg?越大。 不考虑其它变量的影响,表示任何两变量间的数量(依存)关系。 b=0:回归直线与x轴平行,即X与Y无直线关系; b0:直线从左下方走向右上方; b0:直线从左上方走向右下方; b=0,即回归方程不存在。 统计意义: 当X变化一个单位,Y平均改变的估计值(b个单位)。 5、最小二乘原则? 要求:最小二乘原则,least sum of squares。 实测值与假定回归线上的估计值的纵向距离最短。 各实测值至回归直线的纵向距离平方和为最小。 利用最小二乘原则导出b和a的计算公式。 6、回归线 根据已求得的回归方程,取两点(X1,^Y1)和 (X2,^Y2)用直线连接。 在X实测值的范围内取X1(较小值)和X2(较大值); 把X1和X2代入回归方程,求出^Y1和^Y2; 将 (X1,^Y1)和 (X2,^Y2)两坐标点描绘在散点图中; 用直线连接这两个坐标点,得到方程的回归直线。 绘图时注意,两坐标点之间要隔开一定的距离,以减少回归线的误差。 7、 Y的离均差平方和lYY分解 8、回归方程检验—方差分析 H0:b=0,H1:b0,a=0.05。 SS总=lYY=1.0462; SS回=lXY2/lYY=0.8134; SS残=SS总-SS回=0.2328。 F=(SS回/n回)/(SS回/n回)=20.97** 结论:……有直线关系。 9、回归方程检验—t检验 H0:b=0,H1:b≠0,a=0.05。 sb为样本回归系数标准误。 扩大X的取值范围可减少,使b的估计更稳定。 sY·X为回归的剩余标准差,standard deviation of residuals。 扣除X的影响后Y的变异指标。 F=t2:直线回归中,F检验与t检验等价。 10、总体回归系数b的可
您可能关注的文档
- _家庭版套装训练计划女士版.ppt
- _岩石的成因类型及其工程地质特征.ppt
- _嵌入式系统设计竞赛交流.ppt
- _嵌入式设计竞赛经验交流.ppt
- _市区科技项目会计核算培训.ppt
- _市调与门店数据分析.ppt
- _广东科龙模具有限公司UG编程加工学习资料.ppt
- _应急预案的制订与修订.ppt
- _应用部署和门户管理.pptx
- _弘扬衡中精神打造幸福教育.ppt
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
最近下载
- 百日咳试题附有答案.docx VIP
- 2024年广东省深圳市光明区人大常委会办公室招聘一般类岗位专干12人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- 高中语文任务驱动型材料作文:枯燥与热闹审题指导(含解析).docx VIP
- 某镇卫生院污水设计方案.pdf VIP
- 2024年广东深圳市光明区人大常委会办公室招聘一般类岗位专干3人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- 中考数学经验交流会发言稿.pdf
- 2024年7月广东省深圳市光明区人大常委会办公室招聘10人历年【高频考点汇总500题】模拟卷及参考答案详解.docx VIP
- 《溜冰圆舞曲和雷鸣电闪波尔卡》精品课件2023.pptx
- 水利项目安全评价报告.docx
- 2024年7月广东省深圳市光明区人大常委会办公室招聘10人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
文档评论(0)