医学统计学直线相关与回归.ppt

  1. 1、本文档共113页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学直线相关与回归创新

在1926年美国经济学家乔治·泰勒(George Taylor)创造了裙摆指数理论 所谓裙摆理论,就是指在经济的繁荣程度和女性的裙摆长度成正比例关系。简单通俗的说就是:经济繁荣时代,女性的裙摆会越来越短;经济一旦进入衰退,短裙则随之变成长裙。 年轻女性通过裙摆的高度来反映她们的生活态度。经济繁荣,女性乐观而自信,愿意展示自己美好的身体,而自家庭预算中划分出添置一条迷你裙——彻底的奢侈品——的钱,不存在任何困难;经济不景气,女性失去了自由自在的心情,包裹式的长裙给她们以安全感,说到家庭预算,如果必须添置新衣,那只能是实用的,可以在很多场合出现的——长裙。 小腿一瞥会给人一种独立感和信心;扫帚裙子则是谦逊和朴素的迹象。 而现在,要在具有个性化特征的中国通过观察女性裙摆长度来判断股市更是难上加难,那些前卫的女孩你根本不知道她们穿的是什么,进一步说,对于好多前卫女生,你连她是男是女也分不清。 * * tanh0.9898 ~ tanh2.0770=0.76~0.97 总体相关系数?的95%CI: (0.76, 0.97 ) 四 决定系数 *决定系数(coefficient of determination):回归平方和与总的离均差平方和平方和之比 相关系数的平方r2,数值大小反映了回归贡献的相对程度,即应变量Y的总变异中可用回归关系解释的百分比。 SS总不变,SS回大小决定了相关系数r绝对值大小, SS回越接近SS总,r绝对值越接近1,说明相关的实际效果越好。 * * 四 决定系数 *决定系数(coefficient of determination): 对直线回归的拟合优度检验等价于对总体回归系数的假设检验,其 * * * * 五 直线回归与相关应用的注意事项 (1)根据分析目的选择变量及统计方法 (2)进行相关、回归分析前应绘制散点图; (3)用残差图考察数据是否符合模型的假设条件(P196) (4)结果的解释及正确应用 * * 直线相关与回归的区别与联系 区别: 1. 资料要求不同。 直线回归要求应变量Y服从正态分布,X可以是精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量X、Y服从双变量正态分布,这种资料若要进行回归分析称为Ⅱ型回归。 2.应用情况不同: 直线回归说明两变量间依存变化的数量关系,直线相关则是说明两变量的相关关系????? 3. r与b有区别; 1). 取值范围不同: -1≤r ≤1, +∞≤b≤-∞ 2). 意义不同:r说明具有直线关系的两个变量间关系的密切程度与相关方向; b表示X每改变一个单位,Y平均改变b个单位。 3)回归系数与原度量单位有关,而相关系数无单位 * * 1. r与b正负号一致: r为正时,b也为正,表示两变量是正相关,是同向变化。r为负时,b也为负,表示两变量是负相关,是反向变化。????? 2. r与b的假设检验等价: 对同一组资料若同时进行r与b的假设检验,可得到相同的t值,即 tr=tb;可用r的假设检验代替b的假设检验。 3. Ⅱ型回归 4.可用回归解释相关。 *决定系数:即相关系数的平方r2,是回归平方和与总的离均差平方和之比,反映应变量y的总变异中可用回归关系解释的部分。越接近于1,表明利用回归方程进行预测越有意义。 联系: 第三节 等级相关 乡 编号 黄曲霉毒素相对含量 肝癌死亡率(1/10万) X Y 1 0.7 21.5 2 1.0 18.9 3 1.7 14.4 4 3.7 46.5 5 4.0 27.3 6 5.1 64.6 7 5.5 46.3 8 5.7 34.2 9 5.9 77.6 10 10.0 55.1 * * 第三节 等级相关 Spearman等级相关 rs为等级相关系数:说明2个变量间相关关系的密切程度与相关方向的。 总体相关系数ρS * * 第三节 等级相关 等级相关又称为秩相关,是一种非参数统计方法,适用于: ①双变量来自非正态总体 ②总体分布未知, ③数据一端或两端有不确定值的资料(开放型资料) ④等级资料。 * * 第三节 等级相关 乡编号 (1) 黄曲霉毒素 相对含量 肝癌死亡率 (1/10万) d (6)= (3)-(5) d2 (7) X 秩次 Y 秩次 (2) (3) (4) (5) 1 0.7 1 21.5 3 -2 4 2 1.0 2 18.9 2 0 0 3 1.7 3 14.4 1 2 4 4 3.7 4 46.5 7 -3 9

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档