医学科研设计与统计学思维.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
体重:t=2.35,p=0.038 身高:t=1.99,p=0.071 理论上单变量假设检验不能代替多变量假设检验,主要理由: ①m次单变量假设检验增加假阳性错误的概率,设每次单变量假设检验的检验水准定为a,做完m次检验I类错误的概率增加为am=1-(1-a)m。 ②单变量假设检验只说明某一变量在数轴分布上的组间差别,不能反映多个变量在平面或空间上的差别,两者的意义不同,各自说明各自的问题,不能相互代替。如表14-8的两组数据,分别对两组新生儿出生时的体重与身长做单变量t检验:体重t=2.35,p=0.038,身长t=1.99,p=0.071,结论不明确。但多变量的Hotelling T2检验:T2=9.87,F=4 .58,P=0.03,拒绝H0:μ1= μ2,两组在平面分布上差别如图14-1所示。 二组的平面分布 二组的空间分布 六、充分利用现有的监测或体检数据 信息量大(范围广、指标多) 时间跨度长 缺乏系统设计 无质量控制 缺省值多 不能满足特定的研究 体检数据实例: 高血压监测数据: (一)、分析的计划和步骤 1、资料的整理 原始数据往往是不能直接进行分析的,根据资料的类型 和目的,将资料整理成所需要的形式。整理过程包括: (1)、原始体检表格的整理、核对 。 (2)、资料数据库的建立和资料输入根据样本大小可选择 合适的软件建立数据库,资料输入时最好设计能自我纠错的功能, 资料输入需要恰当的编码。 2、统计描述 描述体检对象的一般特征,如计算不同年龄、性别、职业、疾病 类型的构成比,计算疾病发病频率指标、患病频率指标、死亡频 率指标等等。 3、统计推断 统计推断主要是计算相关的指标,如比值比、患病率等,并进行 假设检验。假设检验的方法既有单因素分析方法,也有多因素分析 方法。如χ2检验、回归分析等。根据资料的类型,还可选择分层 分析。 (二)、 充分利用丰富的监测或体检资料 (1)一组体检资料的背景介绍:某体检中心收集了一批体检者的多项体检指标,其中是否有冠心病(G)、性别(X1)、年龄(X2)、是否有高血压(X3)、是否吸烟(X4)、胆固醇含量(X5)甘油三酯含量(X6)、低密度脂蛋白含量(X7)、高密度脂蛋白含量(X8)、脂蛋白α含量(X9)、载脂蛋白A1含量(X10)、载脂蛋白B含量(X11)、基因型XbaI(X12)、基因型EcorI(X13)、用药情况(X14),资料的格式如表1所示。 表1 多项指标的体检结果 (2)如何充分利用丰富的体检资料:有些人仅运用简单的统计分析方法处理多因素多指标的体检资料。例如,求一组定量指标的均值和标准差、用t检验分析某定性分组变量的某两个水平对定量观测结果的影响是否显著、用简单的直线相关和回归分析方法研究某两个定量指标之间的直线相关关系和直线回归关系等。这样一来,将会牺牲大量有用的信息,得到一些支离破碎,有时甚至是错误的结论。体检资料往往都是非常丰富的,它不仅包含有定性指标,也包含有定量指标。如何充分利用丰富的体检资料,发掘资料中所蕴藏的各种有用信息,尤其要注意揭示变量之间的内在联系,是一个值得重视的问题。 (3)根据研究目的合理选用统计分析方法:下面先给出研究者希望达到的一系列目的,并逐一选择相应的统计分析方法。 1.对冠心病人而言,直接分析某种基因型取不同水平时7项血脂指标的均值和均值向量之间的差别有无显著性意义? 2.对冠心病人而言,同时分析“性别、吸烟史、高血压史、某种基因型”对7项血脂指标的均值和均值向量的影响有无显著性意义? 3.对冠心病人而言,在设法排除“年龄、性别、吸烟史、高血压史和用药情况”等因素影响的前提下,分析某种基因型取不同水平时7项血脂指标均值之间的差别有无显著性意义? 4.对冠心病人而言,试对7项血脂指标间的内部从属性作客观评价。 5.对冠心病人而言,试对7项血脂指标间的亲疏关系作客观评价。 6.对冠心病人而言,假定病情轻重可通过7项血脂指标来很好地反映出来,试根据7项血脂指标的数据,将它们划为3组,以便作出关于病情“轻、中、重”的评判,可有的放矢地采取不同方案对不同病情的患者进行治疗。 7.利用正常人与冠心病人的7项血脂指标数据,建立一种方法,用来对一个怀疑患有冠心病的就诊者进行辅助诊断。 8.利用正常人与冠心病人的全部资料,建立一种方法,筛选出冠心病的危险因素,并且,当各危险因素在其取值范围内分别取某确定值时,预报某人患冠心病的概率有多大。 (4)分析:为回答上面的第1个问题,需要明白:基因型是一个定性的分组变量,而7项血脂指标都是定量的观测指标。通常把定性的分组变量称为“试验因素或影响因素”,把定量的观测指标称为“反应变量”。此时,若每次只分析一个反应变量,就

文档评论(0)

小蜗牛 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档