华西统计22 统计方法选择与结果解释PPT.ppt

华西统计22 统计方法选择与结果解释PPT.ppt

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华西统计22 统计方法选择与结果解释PPT

统计方法选择与结果解释;第一节 统计方法的正确选择 ;; ; 1. 研究目的 一是通过比较,回答观测指标的差别是否归因于处理因素或分组因素,在本教材范围内所涉及的主要是单变量问题。 二是分析变量之间是否存在某种联系,这主要涉及相关分析和回归分析,在本教材范围内所涉及的主要是双变量问题。 ;组别;2. 设计类型 从实验研究设计来看,常见的设计类型为 完全随机设计(成组设计) 配对或配伍设计(随机区组设计) ; 两样本(成组)t 检验 单因素(完全随机设计)方差分析 卡方检验(独立样本) 两样本Wilcoxon秩和检验或多样本Kruskal-Wallis秩和检验;配对t检验 配伍组(随机区组)设计方差分析 配对卡方检验 配对(符号秩和检验)或配伍设计的秩和检验(Friedman秩和检验)等。;3. 资料类型 对于定量变量,选择它所对应的统计方法? 对于定性变量,选择它所对应的统计方法? ;4. 数据特征 对于同一设计类型和同一资料类型,仍然有许多方法可以选择。;表3. 九个测定点用甲、乙两种方法的测定结果(μg/m3) ;t检验和方差分析属参数检验方法,对数据要求较高,通常要求数据服从正态分布和方差齐性。 如果服从该条件或经变量变换后服从条件,则采用参数检验方法,否则采用秩和检验这类非参数检验方法。;5. 对比组数 单组问题(样本与与已知总体参数比较) 两组问题 多组(3组或以上)比较 注意,多组比较在差别有统计学意义时,需再进行两两比较。;6. 样本含量 在样本较小时: 如果是一个样本率与总体率的比较,可采用直接计算概率的方法如基于二项分布的确切概率法。 如果是四格表资料则采用Fisher确切概率法或校正卡方检验。 对于均数比较问题,一般情况下采用t检验。 在大样本时:可考虑Z检验作近似。;在实际工作中,遇到的实际问题可能并非如此简单,须结合专业问题和所要分析的具体内容加以综合考虑和仔细判断,有时需对各种统计方法加以综合运用。 ;此外: 当分析目的是分析变量之间是否存在某种联系时,这就涉及到双变量的分析方法,即相关关系或回归关系的分析。 需注意相关分析和回归分析的区别与联系;关联性分析: 对于定量变量,需根据两个变量是否满足双变量正态分布,相应地采用Pearson积矩相关分析或Spearman秩相关分析。 对于等级变量则直接采用Spearman秩相关分析。;对分类变量,常计算列联系数进行分析 对于R×C表资料,需注意区分是单向有序或者是双向有序 对于一个二分类变量和一个等级变量之间的线性关联通常采用线性趋势卡方检验 ;表4. 某市不同年级中学生吸烟率 ;生存分析: 是一类较为特殊的针对具有截尾数据的生存时间数据所进行的分析 针对分组和未分组资料,方法有所不同;多变量的数据分析: 多重线性回归是对反应变量为定量变量进行的多变量分析 Logistic回归是对反应变量为分类变量所进行的多变量分析 Cox比例风险回归是对反应变量为含有截尾数据的生存时间所进行的分析;;;数据探测 数据分布特征、方差齐性、散点图绘制、离群值的发现,以及了解数据是否符合特定统计方法的应用条件等,必要时可进行变量变换或转换以满足分析的需要。 数据探测将增加对数据的基本了解,为进一步的分析奠定基础。;统计描述 统计描述内容? 注意首先要区分变量类型;统计推断 在数据探测和统计描述的基础上选择恰当的统计推断方法分析资料。;区间估计: 总体均数区间估计:可采用t分布或正态分布原理进行估计 总体率区间估计:可采用二项分布、Poisson分布或正态分布原理进行估计;2. 混杂因素的控制 非研究因素的“可比性”问题 可比性好,各组观测指标之间的差异只能归因于研究因素而不是其它原因;如果各组在研究因素之外的某种或某些因素有所不同,那么这个或这些其它因素的效应就可能同研究因素的效应混淆在一起 在这种情况下,通常的统计分析结论在进行因果推断时常常是不可靠的;对于非研究因素不具可比性的资料,应采用统计调整技术消除那些因素的影响 对于具有多个变量的复杂情况,则需采用多变量分析技术加以调整;分析阶段控制混杂因素可采用: 1) 分层分析 2) 标准化法 3) 协方差分析 4) 多重回归;1) 分层分析 Example:研究吸烟与健康的关系; 吸烟者与不吸烟者死亡率的直接比较可能存在问题 因为: 吸烟者多为男性,而男性比女性更易患心脏病而发生死亡,吸烟者与未吸烟者之间死亡率的差异也许是因为性别的差异 ;为了排除这种可能性,可以性别因素分层,再比较吸烟与非吸烟者的死亡率: 男性人群中,吸烟与不吸烟者进行比较 女性人群中,吸烟与不吸烟者进行比较;年龄可能又是另外一个混杂因素,这就需要对年龄进

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档