- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简单回归与相关PPT
本例回归系数的标准误为 代入式(14-10)中得到统计量 t=0.141/0.0207=6.812,其自由度v=20-2=18。 查附表2:t界值表得t0.05/2(18)=2.101,本例|t|=6.812 t0.05/2(18),故有P<0.05。按α=0.05水准拒绝无效假设,故可以认为回归系数具有统计学意义,即总体回归系数β≠0。 以上两种检验结果一致,均表明血中胆固醇水平与年龄之间具有直线关系。 估计总体回归系数?95%的可信区间 本例:b=0.141 n=20 t0.05,18=2.101 sb=0.0207 总体回归系数?95%的可信区间为:0.097—0.184 四、直线回归方程的应用 直线回归方程主要用于预测与控制。 1.统计预测 (1) 的估计:当X为某一定值时 的均数。 是有抽样误差的,其标准误为 ,其计算公式为: 对一已知的自变量值X0,接回归方程求出的预测值 ,是在给定X下的条件平均值的点估计值。对此条件平均值的100(1-α)%可信区间的计算公式为: 式中tα,v是当自由度v=n-2时 t分布的双尾1-α的临界值。 例14-2 用例14-1所求直线回归方程,试计算X0=50岁时, 的95%可信区间。 对例14-1资料,已知n=20, t0.05/2(18)=2.101,回归方程为: ,当已知 X0=50岁,估计的条件平均值的点估计值 为 =2.661+0.141×50=9.71 用式(14-11)计算出 的标准误 为: 再用式(14-12)计算出 的95%可信区间为: (9.71-2.1016×0.3418,9.71+2.1016×0.3418)=(8.99,10.43)。所以当年龄为50岁时,胆固醇的条件平均值 的95%可信区间为(8.99,10.43)mmol/L。 由以上计算可知,当 时,条件平均值 的可信区间最窄,越远离 时,可信区间越宽,如图14-3所示。 (2)个体Y值的容许区间 总体中,当X0为某定值时,个体Y的波动范围,其标准差为 ,按式(14-13)计算 为了简化计算,当X与 接近且n充分大时,可用SY.X代替 。 个体Y值的100(1-α)%容许区间的计算可按公式(14-14), (14-14) 例14-3 用例14-1所求直线回归方程,试计算X0=50岁时,个体Y值的95%容许区间。 再用式(14-14)计算出个体Y值的95%容许区间为: (9.71-2.1016×1.2230,9.71+2.1016×1.2230)=(7.14,12.28) 所以当年龄为50岁时,个体Y值的95%容许区间为(7.14,12.28)mmol/L。 对比式(14-11)与式(14-13)可知,同一X值下,个体Y值的容许区间要宽于条件平均值的可信区间。 2.控制 控制是指当要求应变量Y在一定范围内波动时,如何控制自变量X的取值。例如,为使一名糖尿病人的血糖维持在正常范围(4.44~6.66mmol/L),如何控制血中胰岛素水平?这可以通过对回归方程的逆运算来实现。例如资料已建立了由胰岛素估计血糖平均水平的直线回归方程,问:欲将血糖水平控制在正常范围的上界即6.66mmol/L以内时,血中胰岛素应维持在什么水平上? 已知回归方程为: ,取α=0.05,本例是求当个体Y值取6.66mmol/L时的X值,故取t界值表的单侧t0.05(18)=1.734,所得方程为 解得X=32.64(mU/L),即如欲将一名病人的血糖控制在6.66mmol/L以内,胰岛素可维持在32.64(mU/L)以上。 血 糖 y 胰岛素x 6.66 x0 控制值 个体y单侧95%的上限 当x大于x0时,个体y单侧95%上限在控制值 (6.66)之内,当x小于x0时,个体y单侧 95%上限超过控制值 第二节 直线相关 欲了解两个随机变量X与Y之间相关关系及其密切程度,可用直线相关分析方法。直线相关(linear regression)又称简单相关,此方法适用于X和Y都服从正态分布的资料。 一、相关系数 两变量
文档评论(0)