第十三章 方检验与方差分析-医学课件.ppt

第十三章 方检验与方差分析-医学课件.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十三章 方检验与方差分析-医学课件.ppt

* 第二节 无关联性检验 检验的另一个重要应用是对交互分类资料的独立性检验,即列联表检验。在上一章,我们曾多次提到过性别与收入高低有无关联的问题,在实际中类似的问题很多。例如受教育程度与投票行为有无关联?吸烟与寿命长短有无关联?家庭小孩多少与收入多少有无关联?受教育时间长短与收入多少有无关联?血型与某种性格上的差异有无关联?等等,把这类问题上升到一般,就是在列联表的基础上考察变量X与Y有无关联。由于列联表一般是按品质标志把两个变量的频数进行交互分类的,所以: ① 检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点; ②如何求得列联表中的理论频数就成了独立性检验的关键。 * 1、独立性、理论频数及自由度 应用此式,不必计算理论频数 计算与 这个检验统计量相联系的自由度 算出 统计量之值并定出其自由度后,就可以依前述的方法,在给定了显著性水平之后,来对X,Y属性无关联的零假设进行检验了。 * 2.关于频数比较和连续性修正 用卡方 作为列联表的统计量,有两点我们应该特别注意。首先,列联表检验是通过频数而不是通过相对频数的比较进行的。其次,使用卡方 对列联表进行检验.每一格理论频数 必须保持在一定数目之上。 * 3.列联表的卡方分解 若一个复杂的列联表具有显著性,有时需要检查子表以确定表格的那一部分卡方 影响最大。一种可行的简便方法就是考察每一格的残差 ,其公式为 根据计算结果可以知道哪一个残差对卡方影响大。另一种方法是利用卡方分布的可加性,把r×c表的总体卡方分解为若干独立部分。 * 第三节 方差分析 方差分析,是一种很重要的分析方法,它可以检验两个以上样本均值之差。方差分析是均值差检验的推广,一般用于处理自变量是一个(或多个)定类变量和因变量是一个定距变量之间的关系。方差分析所包含的假定与均值差检验所包含的假定差不多,例如正态分布、独立随机样本、等方差性等,但检验本身却很不相同。方差分析直接涉及的是方差而不是均值和标准差。同时,比较也不取两种估计量之差,而是取两种估计量的比率。在两种估计量彼此独立的前提下,两种估计量之比率F具有已知的抽样分布,因而可进行很简单的检验。 * 1.总变差及其分解 总变差 :在方差分析中记作SST,它表示 对于总均值 的偏差之平方和。即: SST= 式中: ni是第i个样本的容量, n= 为什么会形成总变差这个散布度呢? 一是三个样本可能不同,这使全部数据 有三个“中心”; 二是随机抽样误差的影响,使数据在每个中心附近有散布。 * 总变差分解 * 可以看出,总变差分解成两部分: 第一部分是各观测值 对其所属类别均值 的偏差的平方和,称为组内变差(Within-groups Sum of Squares),记作SSW。组内变差反映了数据围绕各“中心”的散布程度,即反映了 因随机波动所产生的变异,与自变量因素无关。换言之,SSW是自变量因素所没有解释的 的变异。因此,又称之为残差。 第二部分是组间平方和 (Between-groups Sum of Squares),记作SSB ,它涉及到诸类别均值 对总均值 的偏差,反映了前表中数据的c个“中心”的散布程度。 * 2.关于自由度 弄清了组间变差和组内变差,检验“A1≠A2≠A3”(也就是零假设μ1=μ2=μ3)的思路也就梳理出来了:关键是比较两种变差是否有显著差异。若第一种变差明显大于第二种变差,则认为家庭因素对孩子图书消费是有影响的;若第一种变差与第二种变差之间无显著区别,则不能认为家庭因素对孩子图书消费有影响。但在统计学上,方差分析不取两者之差而取两者之比来进行这种比较。而且,方差分析不是直接用SSB/SSW作为检验统计量,而是用 可以解释的方差/不能解释的方差 作为检验统计量,即: * 组间平方和代表c个样本均值对总均值的偏差。也就是每个可看作为一个单位,c个可看作为c个单位,有c个自由度,求用去一个自由度。因而,与组间平方和相联系的自由度为c―1。再看组内平方和,计算时每列失去一个自由度。因而,与组内平方和相联系的自由度为n―c。最后看总平方和,计算总均值时失去一个自由度。因而,与总平方和相联系的自由度为n―l。总的来看有: 总自由度=组内自由度 + 组间自由度 * 上式是在在零假设(H0:μ1=μ2=…=μc)之下,检验统计量Fo的计算公式。 理论证明:上式服从分子自由度为k1=c―1、分母自由度为k2=(n―c)的F分布。于是,给定显著性水平α,我们就可以很方便地从F分布表中查到临界值Fα(c

文档评论(0)

liuxiaoyu92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档