- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
应用统计学;第六章次数资料的χ2检验;一、χ2检验概述
1.χ2检验的定义
对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验(根据样本的频数分布推断总体分布)
2.χ2检验与(参数)假设检验的区别
1)假设检验的数据是连续变量,χ2检验的数据是离散变量
2)假设检验数据的总体呈正态分布,χ2检验的数据的总体分布未知
3)假设检验是检验总体参数,χ2检验是检验总体分布
;3.χ2检验的用途
1)独立性检验:研究两个或两个以上的次数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立
2)适合性检验:先通过一定的理论分布对样本的理论数进行推算,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合的结论
3)同质性检验:一个样本方差;二、χ2检验的原理
χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。
实际值与理论值之间的偏离程度就决定其χ2值的大小:
1)理论值与实际值之间偏差越大,χ2值就越大,越不符合
2)理论值与实际值之间偏差越小,χ2值就越小,越趋于符合
3)理论值与实际值完全相等时,χ2值就为0,表明完全符合
;1.χ2检验的统计量
1)χ2检验统计量;2.χ2检验的步骤
假设:
H0:观测值=理论值,观测值与理论值的差异是抽样误差
HA:观测值≠理论值,观测值与理论值的差值不是抽样误差
确定显著水平:α=0.05或0.01
计算统计量χ2:
;3.χ2检验的注意事项
1)χ2检验要求样本为随机抽样所得,且代表性好
2)χ2检验是对次数资料的检验,连续型数据需分组进行检验
3)总体分布未知的频率或构成比数据,用χ2检验
4)χ2检验容易犯第II类错误,不易发现实际存在的统计学差异
5)df=1时,需进行连续性矫正:;三、独立性检验
检验两个(或多个)因子彼此之间是否相互影响
医学和遗传学上,当试验结果以有序的分组变量表示时,不能用独立性检验法进行检验,而使用秩和检验或Ridit分析
2×2列联表的独立性检验
r×c列联表的独立性检验;1.2×2列联表
A、B是随机试验中的两个事件,其中A可能出现r1、r2个结果,B可能出现c1、c2个结果,两因子相互作用(同时出现或不出现、其一出现)分别以O11、O12、O21、O22表示,可用2×2列联表的形式表示:
;2.r×c列联表;3.理论数和χ2值的计算;例1给药方式与疗效2×2列联表;例2:农药对烟蚜毒杀效果的2×3列联表;例3:肺门密度与矽肺期次的3×3列联表;例4:碘治疗甲状腺肿效果与年龄关系3×4列联表;4.列联表的精确概率法
小样本列联表的统计检验方法
Fisher精确概率法
2×2列联表(四格表); 1)数据组合
在周边合计(a+b、c+d、a+c、b+d)不变的条件下,用公式计算表内数据的各种组合的概率
假设a+b最小(组合数为周边合计中最小值加1),则
; 2)概率计算; 3)检验
双尾检验与单尾检验的累积概率方法不同:
a.双尾检验时,进行两侧的概率累加
b.单尾检验时,只进行一侧的概率累加
ad-bc0时,累加aidi-bici≥ad-bc一侧
ad-bc0时,累加aidi-bici≤ad-bc一侧
;例5:为研究53BP2对肿瘤发生易感性的影响,建立了该基因的基因敲除小鼠,其等位基因杂合型(-/+)和野生型(+/+)小鼠在接受γ射线照射之后的肿瘤发生情况记录如下表。问该基因是否影响小鼠对肿瘤的易感性?;解:组合概率计算; 检验:
双尾检验,ad-bc=-114
零假设H0:该基因型与小鼠对肿瘤的易感性无关;
备择假设HA:该基因型与小鼠对肿瘤的易感性相关。
确定显著水平:α=0.05
概率计算;四、适合性检验
定义
检验观测数与通过某一理论模型计算所得的理论数是否符合,相当于1×c的列联表检验,也称为单因素离散数据的χ2检验。
自由度
df=k-1-r
k为数据分组数,r为利用样本估计总体参数的个数。
正态分布的参数为μ、σ;二项分布的不存在参数估计。
χ2统计量
;1.正态分布检验
1)理论数
编制频数分布表:χ2检验要求各组理论数不小于5,不满足要求时需进行对相邻的组进行合并;
计算各组的理论数:对各组上下限进行标准化,计算各组段的正态分布概率,然后根据概率和观测总次数计算理论数。
2)自由度:df=k-1-r
当总体参数μ和σ均已知时r
文档评论(0)