SAS学习系列15统计学基础知识Ⅱ—统计表,统计图.docx

SAS学习系列15统计学基础知识Ⅱ—统计表,统计图.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS学习系列15统计学基础知识Ⅱ—统计表,统计图

15.统计学基础知识Ⅱ—统计表,统计图(七)统计表统计表和统计图都是表达统计资料的重要工具。统计表,表达统计资料具体、明确,可以用来表达定性资料、定量资料、混合型资料;统计图,表达统计资料形象、生动,但只能要么表达定性资料、要么表达定量资料。一、表达定性资料的统计表1. 二维2×2表列联表(2个定性指标)(1)完全随机设计从全体对象中随机抽取n个个体,然后按属性A、B的两个分类进行两两组合分成四格,得到相应的2×2的频数表。 (2)队列研究设计若把全体研究对象按因素A(是否接触某危险因素)分为两组(接触组、非接触组),再对每组的个体进行跟踪观察,并按因素B(是否患病)分成两组(患病组、未患病组),得到的2×2表。(3)病例-对照研究设计若把全体研究对象按因素B(是否患某病)分成两组(病例组、对照组),再对每组中的个体进行回顾性调查,并按因素A(是否接触某危险因素)分成两组,得到的2×2表。 (4)配对研究设计 n个受试对象(或一组样品)分别用甲乙两种检测方法进行检测,并按测定结果(阳性+,阴性-)分类计数,即按“都为阳性,一阳一阴,一阴一阳,都为阴性”四种情况分别计数,得到的2×2表。2×2列联表,都可以作相关分析(两属性是否有相关关系)、独立性检验(或两总体率之间差异的显著性检验,用Fisher精确检验);2×2队列研究设计,常需要先计算相对危险度RR(=af/ce),并做假设检验:H0:RR=1;H1:RR=0. 做该检验需要用Mantel-Haenszel统计量(U统计量)。2×2队列研究设计和2×2病例-对照研究设计,可由经验Logistic变换公式计算Zi统计量,进而做U检验。2×2配对研究设计,检验两种检测方法之间有无显著性差别。 2. 二维R×C列联表(R,C≥2)(1)双向无序R×C表 (2)单向有序R×C表(3)双向有序属性不同R×C表 (4)双向有序属性相同R×C表适用的分析、检验方法:双向无序R×C表,所选用的统计方法应当与分组变量各水平的先后顺序或取值大小无关,仅与表中总频数、各行的合计、各列的合计有关。符合这些要求的方法有Pearson的拟合优度检验检验、基于似然函数(或熵的分解)导出的似然比检验、对数线性模型、SAS的FREQ过程步进行Fisher精确检验。单向有序R×C表,所选用的统计方法应当与有序的那个分组变量各水平的先后顺序或取值大小有关。显然,通常的检验已无能为力,应考虑把有序变量当作半定量指标在计算中加以考虑的方法:秩和检验、Ridit检验、CPD分析、有序变量的Logistic回归模型、有序变量的对数线性模型。双向有序属性不同R×C表,当把两个属性看成地位平等的相互关系时,常需要考虑它们之间是否存在线性关系,即需要对资料进行相关分析(Spearman秩相关分析、典型相关分析);若把一个属性当成自变量,另一个属性当成因变量,常需要考察它们之间是否存在直线变化趋势,即需要对资料进行线性趋势检验(U检验、检验:“利用回归思想产生的与线性回归有关的分量和偏离线性回归的分量”)。双向有序属性相同R×C表,两个分组变量都是“测定结果”,且档次划分也相同(有序)。对这种资料,研究者关心的不是两变量之间是否存在相关性或线性趋势,而是这两种测定结果的一致性如何。适合采用一致性检验:Kappa检验。特别地,如表3.2.8,研究者可能更关心:文化课成绩与体育锻炼达标的等级之间是否呈现某种特殊的变化趋势(直线趋势模型,即主对角线上的频数占大多数,之外的频数之和趋于0),可以用前面线性趋势检验、或一些特殊模型:对称模型、条件对称模型、对角线模型。注:有时候若想要更多的挖掘R×C表的统计信息,还可以对R×C表进行分割,得到若干2×2表做进一步研究。3. 高维列联表(变量个数≥3)例如,下面是三维列联表: 处理高维列联表资料的方法,借助统计软件有Logistic回归模型(只能分析自变量对因变量的影响)、对数线性模型(可分析全部变量及其交互作用对列联表中格网格上理论频数之对数的影响);也可以将高维列联表压缩为二维列联表再进行处理。4. 具有重复测量设计的定性资料(做方差分析)(1)单因素重复测量资料:方差分析的总思想:将总变异分解为:个体间(between subjects)变异与个体内的变异。其中个体内变异是与重复因素有关的变量。(2)双因素重复测量资料方差分析总思想:将总变异分解为:对象间(between subjects)变异与对象内(within subject)变异,其中对象内变异是与重复因素有关的变量。二、定量资料的统计表1. 随机区组设计一元定量资料 适合做方差分析,事先需要检验正态性和方差齐性(若不满足则要数据变换和非参数检验)。2. 含一个协变量的随机区组设计一元定量资料初始体重x是协变量,适

您可能关注的文档

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档