- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
常用统计
Hosmer 和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为LOW,1表示低出生体重儿,0表示非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。 哑变量 Forward:Conditional (最可靠) Forward:LR Forward:Wald (应当慎用) Backward: Conditional (最可靠) Backward:LR Backward:Wald(应当慎用) 6 种筛选自变量的方法 逐步回归 拟合效果判断指标 对数似然值与伪决定系数 模型预测正确率 ROC曲线 分层卡方检验 条件Logist回归 多分类Logist回归 生存分析 聚类分析 判别分析 曲线拟合 析因设计、正交设计的方差分析 …… Acknowledgement 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 推荐参考书 如某种新的降压药,平均降低血压 2 mmHg,若样本含量较大,误差又较小,统计检验可能会得到“P<0.05”的结果,但在临床上却认为此新药的疗效没有多大提高。 * 无序数据 分类数据的分层大于2时,又称为多分类数据 如性别(男、女)、血型(A、B、O、AB型)等。有序数据如肿瘤的分级(I级、II级、III级)、 * Kappa一致性检验 Kappa检验会利用列联表的全部信息,而McNemar检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去使用价值 某食堂食物中毒,现想通过调查发现,吃某海产品和食物中毒发生是否具有关联性,以及吃了某食物的人是没吃海产品的人的几倍? OR可以度量关联程度 RR vs. OR RR: 实验组人群反应阳性概率与对照组人群反应概率的比值。用于反映试验因素与反应阳性的关联程度。 OR:是比值的比,是反映阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。在下列两个条件均满足时,可用于估计RR值: 所关注的事件发生概率比较小0.1; 所设计的研究是病例对照研究 为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成3组,分别按三种不同剂量服用该药,镇痛效果如下表。 关于多个独立样本率多重比较 若要明确那两组间不同,还需进一步作多组间的两两比较。 3个处理组,两两比较有3种,这样增大了I类错误的机会,须修正检验水准。例如原来检验水准α=0.05,比较3次,检验水准应取α=0.05/3=0.0167 相关分析 连续变量的相关指标(最常见) Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时 相关系数r是一个无单位的量值-1r1 r0为正相关,r0为负相关 lrl越接近于1,相关性越好,越接近于0,相关性越差 Spearman等级相关系数:当数据不满足条件双变量正态时 相关分析 例 某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直接相关关系。 偏相关分析 简单回归分析 记得和相关一样,先做散点图 相关与回归 在意义和应用上,回归反映两变量间的依存关系,相关反映两变量间的相互关系 回归于相关可以相互解释: r2=SS回/SS总 即相关系数的平方是应变量Y的总变异中归因于X的部分。r2又称为确定系数。 多重线性回归模型 应用条件 自变量与因变量之间存在线性关系,可以通过绘制“散点图矩阵”予以考察 各观测间相互独立 残差服从正态分布 方差齐性 为研究男性高血压患者血压与年龄、身高、体重等变量的关系,随机测量了32名40岁以上男性的收缩压y、年龄x1、是否吸烟x2、体重指数x3,试建立多重线性回归方程 回归模型的建立步骤 绘制散点图,观察变量间的趋势 考察数据分布,进行必要的预处理 进行直线回归分析 残差分析 强影响点的诊断和多重共线性的判断 绘制散点图矩阵 残差分析 残差分析 残差分析 直线回归 独立性 强影响点的识别 共线性的识别 Logist回归 Logistic回归是适用于反应变量(即因变量)为分类变量的回归分析,近年来在许多研究领域得到了广泛的应用。 Logistic回归按照反应变量的类型可分为: ? 两分类反应变量的Logistic回归; ? 多分类有序反应变量的Logistic回归; ? 多分类无序反应变量的Logistic回归。 Logistic回归按照研究设计的类型可分为: ? 非条件Logistic回归,即研究对象未经匹配; ? 1:1的条件Log
文档评论(0)