统计学第七章卡方检验解析.ppt

第七章 ?2检验 ?2检验用途 单个频数分布的拟合优度检验 完全随机设计两组频数分布?2检验 多组频数分布的?2检验 配对设计下两组频数分布?2检验 ?2分布和拟合优度检验 ?2分布 ?2分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的?2分布, 其概率密度在(0,+∞)区间上表现为L型,如图7-1对应于自由度 1的曲线,取较小值的可能性较大,取较大值的可能性较小。 ?2分布和拟合优度检验 图7-1, ?2分布的形状依赖于自由度ν的大小,当自由度ν>2时,随着ν的增加,曲线逐渐趋于对称,当自由度ν趋于∞时,?2分布逼近正态分布。各种自由度的?2分布右侧尾部面积为α时的临界值记为 列于附表8。 ?2分布和拟合优度检验 拟合优度检验 拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定的理论分布。 拟合优度检验步骤: 1.建立检验假设 H0:总体分布等于给定的理论分布 H1:总体分布不等于给定的理论分布 ?2分布和拟合优度检验 2.计算检验统计量 实际观察到的频数用A表示,根据H0确定的理论频数用T表示,则大样本时统计量,自由度 K-1-(利用的参数个数) ?2分布和拟合优度检验 以上两个公式?2检验的基本公式,所有其它形式的?2检验公式都来源于此。 ?2值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立, ?2值不会太大;反之,A若与T差距大, ?2值也大;当?2值超出一定范围时,就有理由认为原假设不成立。 3.确定相应的概率P,作出推断结论 ?2分布和拟合优度检验 例7-1 对表7-1所示数据作正态分布拟合优度检验。136例体模骨密度测量值的均数 1.260;标准差 0.010 检验的假设: H0:总体分布等于均数为1.260,标准差为0.010的正态分布 H1:总体分布不等于该正态分布 ?2分布和拟合优度检验 表7-1 中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数T等于总例数136与各组段概率的乘积,第7列各数之和即检验统计量?2值。 ?2分布和拟合优度检验 计算统计量: 推断结论:自由度 10-1-2 7,查附表8,得到 P 0.50,可以认为该样本服从正态分布。 完全随机设计两组频数分布?2检验 二分类情形——2×2列联表 例7-2 某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗,结果见表7-2。 表7-2 慢性咽炎两种药物疗效资料 完全随机设计两组频数分布?2检验 问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体。因为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相等。 完全随机设计两组频数分布?2检验 (1)建立检验假设 H0:π1 π2 两药的有效概率相同 H1: π1≠π2 两药有效概率不同 检验水准? 0.05 (2)计算检验统计量 完全随机设计两组频数分布?2检验 自由度 ? 2-1 2-1 1 (3)确定p值 查附表8,? 1对应的临界值 , P 0.025。 (4)结论:拒绝H0,两样本频率的差别具有统计学意义。可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(91.1%)高于后者(68.6%)。 完全随机设计两组频数分布?2检验 对于四格表资料,四格表专用公式 完全随机设计两组频数分布?2检验 当n≥40时,如果有某个格子出现1≤T 5,一般需用校正公式 完全随机设计两组频数分布?2检验 例7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表7-4,问两疗法的总体缓解率是否不同? (1)建立检验假设 H0:π1 π2,,两法总体缓解概率相同 H1: π1≠π2两法总体缓解概率不同 检验水准? 0.05 完全随机设计两组频数分布?2检验 完全随机设计两组频数分布?2检验 2)计算检验统计量 ? 2-1 2-1 1 3 确定P值:P 0.1,高于检验水准?,不能拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。 完全随机设计两组频数分布?2检验 特别注意: 当四格表出现T 1或n 40时,校正?2值也不恰当,这时必须用四格表的确切概率计算法(见本章第6节)。 完全随机设计两组频数分布?2检验 多分类的情形——2×C列联表 定性变量具有多分类时, 两个频数分布的数据可表示为一个2×C列联表。 例7-4 北京市1986年城市和农村20至40岁已婚妇女避孕方法情况如表7-5所示(据王绍

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档