15回归与相关_数学_自然科学_专业资料.pptVIP

15回归与相关_数学_自然科学_专业资料.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
直线相关 linear correlation 一元线性回归方程的模型: 或 一元线性回归方程: (二 )原理: 最小二乘法(least square, LS),要求各点与该直线纵向距离(残差)的平方和为最小。 残差(residuals) 残差平方和(sum of squares for residuals) 方差分析的过程: H0: ?=0     H1: ??0 四、模型的预测效果   决定系数(determination coefficient、 R square) 五、应变量的条件均数 的可信区间 六、个体Y值的允许区间 五、模型理论假设 自变量x (independent variable),与应变量Y dependent variable)之间存在线性关系; 正态性:对于X各个取值,相应的Y值总体为正态分布。(随机误差(即残差)e服从均值为零,方差为?2的正态分布;) 等方差:对于x各个取值,残差e的条件方差为?2,且?为常数; 独立性:在给定自变量x的条件下,残差e的条件期望值为零(本假设又称零均值假设); Y的总变异中回归关系所能解释的百分比,体重可解释肺活量变异性的56.17% 。0﹤R2﹤1,回归贡献的相对程度 预测效果检验,亦称回归模型的拟合优度检验,检验回归模型对样本数据的拟合程度,等价对?假设检验: 1.描述两个变量之间的数量依存关系(回归方程有意义时)。 2.预测、控制。在回归方程中代入x ,可得到y 的估计值;代入y可得X。 3.用回归方程可获得精度更高的医学参考值范围。 4.仪器校正。 六、回归方程的应用 七 、应用回归的注意事项 1.不要分析毫无关系的两个变量。 分析要有实际意义,在考虑自变量与应变量关系时,应结合专业知识和生物学规律来判断。 2.分析前,先绘制散点图。 3、回归模型的前提假设 是否满足LINE基本假定,可用学生化残差图简单分析,当条件不满足时,应进行曲线回归分析。 * * 双变量回归与相关 Bivariate Regression Correlation 相关:分析变量间的相关关系 回归:找出变量间的依存(数量)关系,用函数关系式表达出来。 年龄与血压 身高与体重 药物剂量与动物死亡率 环境介质中污染物浓度与污染源的距离 一、直线相关的概念 了解两个正态随机变量间: 1、是否有直线相关关系? 2、如果有,是正相关还是负相关? 3、相关的密切程度如何? 例一:某地一年级42名女大学生的体重(kg)与肺活量(L)数据如下,试分析肺活量与体重有无直线相关关系,及关系的密切程度。 … … 3.0 2.8 3.4 3.1 3.4 2.8 2.8 2.4 2.7 2.2 2.5 肺活量Y (L) 58 52 52 50 50 50 46 46 46 42 42 体重X (GK) 表1 42名一年级女大学生体重与肺活量 完全正相关 完全负相关 零相关 零相关 正相关 负相关 零相关 零相关 医学与生物学很少出现完全相关。 r的正负表示相关的方向。 r的大小表示相关的密切程度。 二、相关系数correlation coefficient ?相关系数(积差相关系数),它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 r ρ -1≤r≤1,没有单位。 r 的符号反映了相关的方向, r 值为正表示正相关,r 值为负表示负相关。 ∣r∣反映相关密切程度,为1表示完全相关,越接近于1,相关越密切(0.2不相关;0.2-0.4弱相关;0.4-0.7中等相关;0.7-0.9强相关;0.9极强相关) 三、r的计算及假设检验 … … 3.0 2.8 3.4 3.1 3.4 2.8 2.8 2.4 2.7 2.2 2.5 肺活量Y (L) 58 52 52 50 50 50 46 46 46 42 42 体重X (GK) 42名一年级女大学生体重与肺活量 2.查表法:由上式可见,tr值只与r值相关,故亦可按υ=n-2,直接查r界值表得P 值,以节省计算。 r的假设检验: 1.t检验 r 的标准误。 总体相关系数的可信区间: 相关系数的抽样分布在?≠0时呈偏态分布 五、线性相关注意事项: 一、对样本的要求: 1、线性(linear),要求在分析前先画散点图,观察有无直线趋势和强影响点。 2、独立(independent):如研究父子身高的相关关系 3、正态分布(normal):任一变量一定时,要求另一变量呈正态分布 4、方差齐(equal variance)

文档评论(0)

kfcel5889 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档