- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 方差分析§8.1 单因素方差分析§8.2 两两多重比较的检验§8.1单因素方差分析单因素方差分析通常仅考察单个因素的不同水平对于指标的影响程度。通常是将各个水平的数据混合在一起,对各水平数据之间的整体性差异进行统计判决。例如,对于多个中心的临床随机试验,就需判定这几个试验中心的数据是否有统计学差异,如果是同质数据则可进行综合分析。否则就要进一步做两两比较以便判断哪些水平有本质上的差异。方差分析和两总体检验方差分析是一种特殊情况下的统计检验,是多组数据之间均值差异的显著性检验。它将各组数据混合在一起,利用一次比较就对所有各组间是否有差异作出整体性判断。随机试验的基本概念1、因素: 试验中影响试验结果的条件称 因素,常用字母 A,B 等表示。 例如:治疗过程中治疗时间、 药物的成份、药物的剂量等。 固定因素:因素水平可准确控制, 当水平固定后该效应也会固定。 随机因素:因素的水平不能严格 控制,或者水平虽能控制,但其 效应仍然不能确定。2、水平: 因素所处状态的不同经常会导致 不同的试验结果。因素在试验中 可能的状态就称作因素的水平。 例如:治疗过程中疗程的长短: 一周、两周等取值。3、指标: 试验结果的数量化表示就称为 指标,也就是实际观测数据。 例如:治疗的效果:体温下降 的程度、健康指标等。4、误差: 除实验中所考虑的因素之外, 其他原因所引起的结果的变化。 试验中的误差主要分为两类: 系统误差和随机误差。 系统误差:测量中总保持不变或 按照某种规律变化的误差,产生 原因已知或未知,应尽量消除。 随机误差:测量中受偶然因素的 影响而以不可预知的方式变化的 误差,它无法消除或修正。 单因素试验设计 单因素试验设计仅仅考虑一个 因素不同水平对试验的影响。 实际中,试验只是将其它主要 影响因素控制在固定的水平, 仅改变考察因素的水平而已。例如:为研究人体对于某药物的不同剂型的吸收程度,现采用 5 种不同的制剂在相同的浓度及用药时间等条件下进行试验,每种制剂分别独立地进行 4 次测量。现假设因素 X 的不同水平分别为:如果将第 i 个水平的第 j 次试验的结果记为 ,那么就可以将所得的数据表示成如下的形式:5 个水平X33一个因素10.860.890.910.9020.800.830.880.843 0.830.900.940.8540.760.810.840.8250.980.930.950.94这里的试验仅涉及“剂型”一个因素,故为单因素试验。其中, “剂型”这一个因素共有5个水平,每个水平可认为是一个总体。未确认这几个水平无差别之前不能求总体平均。由于同一水平的不同数据相当于不同维度,无法直接比较各水平数据的差异,故而只能寻求每个水平的本质特征并据此分析。很自然地,我们假设一个水平只能有一个特定的取值,这相当于一因一果假设。数据的中心性若试验结果仅仅受一个主要因素的影响,而其他因素仅起到一种干扰性的作用,从而可以看作是随机性的因素,则数据就会表现为在某个中心值附近随机波动。Yx1x2x数据中心的度量在数理统计中,数据中心通常是由数据的样本均值来表示:数据的变异由于其他因素以及随机因素的影响,现实中得到的数据总是有差异的,通常都会呈现出在中心值附近随机波动的现象。数据变异的度量在数理统计中,数据的变异通常是由数据的样本方差来表示,数据和均数之间的差值则表示次要因素及随机因素等其它干扰因素的影响。整体变异将一组数据看作是来自于一个总体的数据,从而数据的变异完全来源于总体自身的总体方差。总体方差的大小度量了数据的聚集程度,说明了某因素对于总体的影响程度。各个水平内的变异将各个水平下的数据看作是来自一个整体,考察在当前水平下的数据的整体取值的变化,用方差表示。这里的方差就可以说明这个水平对于总体的影响程度。 各个水平之间的变异将各水平下的数据看作一个整体,同时考察这些子总体之间取值的变化,从而说明由于各水平影响程度的不同对总体变动的影响程度。一个简单的例子比如考虑时期对香山游客数量的影响,那么,季节就表示不同的水平,而每个季节还会有不同的月份,这相当于重复试验。这种情况下,总体差异就表示所有月份间的游客数的总差异,水平差异就是各季节内游客数的总差异,而水平间的差异则表示不同的季节之间其游客数量的统计差异程度。单因素方差分析的模型 估计 = 真值 + 误差是不同水平的共同方差方差分析模型的默认假定各个水平的数据服从正态分布,这与正态分布的背景含义有关。正态分布的实质是假定数据由一个起着主要作用的因素决定,其他的因素只有微小的贡献,且没有偏向性。这个假定的含义是:每个因素只能有一个合理的取值。只有当某对象有某种规律性(常数或规则性)取值,它才能被称之为因素。否则,若对象取值随意变动,没有任何规律性,那它就没有分析的
文档评论(0)