多元统计方法教程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类自变量的哑变量编码 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的, 容易造成错误的解释。 在sas的计算中无法对分类变量做多种处理? 在SAS中使用哑变量必须用数据步建立新变量 西、中西、中三种疗法哑变量化 原资料 姓名 性别 年龄 疗法 张山 1 50 中西 李四 1 20 西 王五 0 18 中 刘六 0 70 中 赵七 1 35 中西 孙八 0 29 西 哑变量化 姓名 性别 年龄 X1 X2 张山 1 50 0 1 李四 1 20 1 0 王五 0 18 0 0 刘六 0 70 0 0 赵七 1 35 0 1 孙八 0 29 1 0 Spss中亚变量的设置 分类变量必须转化。如地区对血压的影响。 等级资料,当等级之间量度不一时必须转化,如正常,超重和肥胖 连续资料不宜直接进入方程时,转化为等级资料或分类资料 亚变量的SPSS处理菜单 亚变量的SPSS处理菜单(二) 亚变量设置(Spss) Indicator Simple Difference Repeated 参照分类为0,其余为1, 即各分类与参照分类比较 除第一类分类外,各分类与 其之前平均分类效应比较 亚变量设置(2) Helmert: 与Difference相反,各水平与其之后水平的平均效应比较 Deviation: 除参照分类外,各水平与分类的总效应比较 Polynomial #◎¥%#¥!◎#¥)9……好像和连续变量有关 手工设置亚变量 还是有缺点的,如 应用于等级资料就 不合适 第二节.条件logistic回归 Sas统计软件所得的结果解释与spss相似 七、条件Logistic回归 对配对/比调查资料,应该用条件Logistic回归分析。 对于配比资料,第i个配比组可以建立一个Logistic回归: 假设自变量在各配比组中对结果变量的作用是相同的,即自变量的回归系数与配比组无关。 配比设计的Logistic回归模型 其中不含常数项。 可以看出此回归模型与非条件Logistic回归模型十分相似,只不过这里的参数估计是根据条件概率得到的,因此称为条件Logistic回归模型。 条件Logistic回归模的回归系数检验与分析和非条件Logistic回归完全相同。 个体配对资料的优缺点 配对资料特别适用于罕见疾病,由于病例的获取不易,匹配并增加对照的例数使研究效率大大增加。小样本的匹配特别有用 Pitman效率递增公式2R/(R+1)『如图』 匹配增加了选择对照的难度 一旦某个因子做匹配,就不能分析它与疾病的关系,另外它与其他因子的交互也不能充分分析。------把不必要的信息列入匹配成为配比过度,如在脑出血危险因素研究中匹配高血压。 个体匹配的经典之作 Herbst,1969,Boston. 8例年轻女性阴道癌病例,每个病例配4个未患病个体做对照。 要求对照与病例在同等级病房中出生时间前后不超过5天,女婴。优选选择与病例出生时间最近者 比较诸多因素。最终得到病因。 1:3配对的例子 1:2配对的例子 SPSS菜单对条件Logistic 回归无能为力 Logistic 回归的注意事项 变量的取值形式 应变量,自变量(亚变量的SPSS处理菜单) 样本含量:经验数在100例以上。配对资料一般要求对子数是自变量个数的20倍以上。 多分类logistic回归 ##_)(^%$……,!! 参考书目 孙振球,医学统计学(供研究生用).人民卫生出版社,2002,第一版。 孙尚拱,医学多变量统计与统计软件. 北京医科大学出版社. 2000,第一版. 刘润幸,医学统计学方法与应用(上、下册). 2001. 第一版. 倪宗瓒,卫生统计学. 2001.第四版 网上资源 / /spss/spssfaq.htm * 线性回归应用于三个方面,1 影响因素分析, 2 估计与预测 3. 统计控制,其中1最常用。 Logistci回归开始是判别分析的一种也可用于预测和判别。由于其判别效果其奇差,但其在流行病学危险因素分析中有着较好的作用。 * 就拿568x 364y 434b三个记录来说,无论是进行排序,增加变量,减少变量,可以改变的是这三个记录在数据库中的位置,但三个记录的每一个变量保持不变。 * 自变量为分类变量,二分的话,直接引入方城即可。如果多分的话,可以用亚变量 BMI为例 有序变量按连续变量处理。 现在一般可以满足这种样本量的要求

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档