- 1、本文档共95页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章非参数检验§7.1卡方检验§7.2秩和检验§7.3游程检验§7.4等级相关分析1拟合优度检验拟合优度检验用于检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相匹配。2用拟合优度检验说明临界值法的优点,和置信区间方法对比。在分布的检验过程中虽然可以得到经验分布函数,但难以定义经验分布函数与已知分布函数的距离,并且难以确定距离的分布。3拟合优度检验通常包括两种类型:检验观测数与理论数间的一致性。通过检验观测数与理论数间的一致性来判断事件之间的独立性。这两种情形一般都用检验。4已知分布的拟合优度检验若已知总体的分布函数为,假设为来自某总体容量为的样本。试通过所得样本判断它是否来自于已知总体。这就是拟合优度检验问题。5为判断该样本是否来自于已知的总体,不妨设该样本的分布为,那么,就可以将这一问题表述为如下的假设检验问题:6假设是来自总体的样本观测值!首先,把的取值区域分为个互不相容的小区域:然后,统计落入每个小区间内的样本数目,即观测频数,记为:。7那么,在原假设成立的条件下,可以分别给出总体的取值落入区间内的理论频数,从而前述问题又转化为:观测频数与理论频数间的差别是否源自随机性因素影响的检验问题。8具体地讲,根据已知分布能计算出总体的取值落在区间内的概率,进而可以得到各个区间内的理论频数:并且有:9那么,从直观的角度,若原假设成立则观测频数与理论频数之间应该尽可能的接近,否则就应该拒绝原假设,认为样本并非来自已知的总体。这时,就需要对两者之间的接近程度进行评价。10为了衡量与之间的差异程度,不难设想利用两者之间对应差值的总和作为度量标准,但由于:因而,我们选择两者之间对应差值的平方和为评价指标。11但是,这样得到的指标只能衡量观测值与理论值之间的绝对差异,却无法得到相对的不符合程度。故可考虑用相对差异进行评价:12不过,上式中每个类别不论其概率大小如何都被同等地看待,这可能会导致偏差。因此,我们又选择作为权重求相对差值的加权平均:13选择作为权重求加权平均值是有原因的,因为在原假设成立的条件下,各小区间内的期望频数是一个不变量,这适合用作判断观测值偏离假设条件的标准。14现在,我们以的情形来讨论:在原假设成立下,样本观测值落入区间的概率为:并且由概率的归一化性质,有:15这样,容量为的样本观测值中有个落入区间内的概率为:由于数据仅仅被划分为两个区间,从而样本观测值中有个落入区间内的概率有类似的结论。16利用中心极限定理,当充分大时,近似地有:进而,有如下的近似结论:17利用条件:不难得到:18从而可以将统计量表示为:19皮尔逊定理假设总体的分布为,其取值落入个互不相容的小区域内的概率分别为:,对应地,容量为的样本观测值落入每个区域的理论频数为。20那么,若每个区域的样本观测值的频数分别为。则对于检验问题:在成立的条件下,当时:2122自由度是1时,统计量的校正公式分布是连续型的,当用于离散型分布时需要进行连续性校正.23例(G.Mendal试验).将丰满的黄色豆与皱皮的绿色豆杂交,得到四种豆子,数目如下:按Mendal理论,这四种豆子的比例应该为9:3:3:1。试判断试验结果是否符合理论结果.24H0:H1:H0不成立从而接受H025随机分组试验随机分组试验是用随机化方法将研究的病人分组,使每一位对象都有同等机会进入治疗组或者对照组,并尽量保证两个组之间的可比性。然后,给予治疗组需要评价的干预措施(例如外科手术、施用药品等),对照组则不给予干预措施,最后通过比较两组结果的差别而得出该干预措施是否有效的结论。26随机分组试验所得的频数资料(或者经过数据变换转化成频数资料)通常可表示成如下的列联表的形式:27配对试验配对试验是对两个有可比性的个体分别用两种方法进行处理,然后观察两者结果的异同。配对试验通常要求每次试验之间相互独立,而每次试验既可以对两个有可比性的个体进行,也可以用于试验前后结果的比较。28配对试验所得的频数资料(或者经过数据变换转化成频数资料)通常可表示成如下的列联表的形式:29非随机分组试验将来自于多个总体的数据按照制定的属性分类。例:两个车间的产品生产情况.判断两个车间的生产情况是否相同.30列联表的定义为了考察几个属性之间的关系,如吸烟和患病之间的关系,将得到的数据按照不同的属性进行搭配所得到的数据表。31通过列联表可以得到如下的几个比率:32列联表的独立性分析现在我们要对吸烟与患病之间的关系作出判定。1。H0:吸烟和患病之间独立;H1:不独立2。考察观测频数和期望频数,并找到一个公式作为检验统计量来计算二者之间的差异。3。查表,确定临界值或P值,决定是否接受H0。33随机变量X和Y之间独立的充要条件在独立的条件下,所以期望频数:34观测频数表期望频数表35自
您可能关注的文档
- 《客户关系管理CMR》第15章国内外CRM产品及其典型案例.ppt
- 《客户关系管理CMR》第16章商业银行客户关系管理.ppt
- 《客户关系管理CMR》呼叫中心.ppt
- 《空调箱保养》培训课件.pptx
- 《礼仪漫谈》培训课件.pptx
- 《神经心理学教学课件》0第一章 神经心理学 绪论.ppt
- 《神经心理学教学课件》1神经心理学 第一章A.ppt
- 《神经心理学教学课件》2神经心理学第一章B.ppt
- 《神经心理学教学课件》3神经心理学第一章C.ppt
- 《神经心理学教学课件》4神经心理第三章额叶.ppt
- 新高考生物二轮复习讲练测第6讲 遗传的分子基础(检测) (原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第3讲 酶和ATP(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第8讲 生物的变异、育种与进化(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(检测)(原卷版).docx
文档评论(0)