实验七 描述性统计分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 非参数统计实验 参数统计学中的许多统计分析方法的应用对总体都有严格的假定,例如,t检验要求总体服从正态分布,F检验要求误差呈正态分布且各组方差为齐性的等等,然而在现实生活中,有许多总体的分布我们却是一无所知或知之甚少,所以在参数模型中所建立的统计推断就会失效,于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息。这就是非参数统计的宗旨。非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。 实验一 卡方检验(Chi-square test) 实验目的: 掌握卡方检验方法。 实验内容: 一、拟合优度检验 二、独立性检验 三、齐性检验 实验工具: SPSS非参数统计分析菜单项和Crosstabs菜单项。 知识准备: 卡方拟合优度检验 检验(Chi—Square Test) 适用于拟合优度检验,适用于定类变量的检验问题,用来检验实际观察数目与理论期望数目是否有显著差异。当检验问题是实际分布是否与理论分布相符合时,在大样本时也可以用分类数据的卡方检验来解决,这时的卡方检验也称为分布拟合的卡方检验。 若样本分为k类,每类实际观察频数为,与其相对应的期望频数为,则检验统计量可以测度观察频数与期望频数之间的差异。其计算公式为: 很显然,实际频数与望频数越接近,值就越小,若=0,则上式中分子的每—项都必须是0,这意味着k类中每一类观察频数与期望频数完全一样,即完全拟合。统计量可以用来测度实际观察频数与期望频数之间的拟合程度。 在H0成立的条件下,样本容量n充分大时,统计量近似地服从自由度df=k-1的分布,因而,可以根据给定的显著性水平,在临界值表中查到相应的临界值。若,则拒绝H0,否则不能拒绝H0。所有的统计软件都可以输出检验统计量的显著性值,也可以根据显著性值和显著性水平作比较,若,则拒绝H0,否则不能拒绝H0。 另外卡方拟合优度检验也可以用来检验某总体是否服从某一特定分布的假设。拟合优度检验中几种常用分布的参数如表4-1: 表4-1 拟合优度检验中几种分布的参数 分布 参数 估计值 参数个数 df 二项分布 1 k-2 泊松分布 1 k-2 正态分布 2 k-3 指数分布 1 k-2 二、独立性检验 假设有个随机试验的结果按照两个变量A和B分类,A取值为A1,A2,…,Ar,B取值为B1,B2,…,Bs,则形成了一张的列联表,称为二维列联表。其中表示A取Ai及B取Bj的频数,,其中: 表示各行的频数之和 表示各列的频数之和 令(),和分别表示各行和各列的边缘概率,对于二维列联表,如果变量A和变量B是独立的,则A和B的联合概率应该等于A和B边缘概率的乘积。因而有如下检验: 在H0成立的条件下,二维列联表中的期望频数为: 则 如果期望频数,则统计量近似服从自由度为的卡方分布。如果Pearson值过大,或p值过小,则拒绝H0,认为变量A和变量B存在某种关联,即不是独立的;否则不能拒绝H0,认为是独立的。 如果期望,则需要将其合并使得期望频数,否则容易夸大卡方统计量值,导致拒绝原假设的结论。 三、 齐性检验 与独立性检验类似的是齐性检验。 实际问题中,假设有n组从不同来源得到的数据,要判定这些数据的来源是否相同(相同的分布),统计上我们可以将这些问题表述为: 假定有k组样本,分别取自k个总体,要检验这k个总体的分布是否相同。这样的假设检验问题称为“齐次性检验”。 对一般的二维列联表,可以提出假设: () 在H0成立的条件下,这些概率与j无关,因此的期望值(理论频数)为,,因此期望值,则检验统计量为: 与独立性检验一样,如果,则统计量近似服从自由度为的卡方分布。如果Pearson值过大,或p值过小,则拒绝H0,;否则不能拒绝H0。 实验背景: 一、据以往经验,机床发生故障的频数服从均匀分布,某车间在一周内统计所有机床发生故障频数的资料如下: 表4-2 故障频数 星 期 一 二 三 四 五 六 故障次数 7 8 3 9 16 17 检验故障频数是否服从均匀分布()? 二、在丧偶问题上的性别因素和地区因素是否独立 按照1996年一个抽样,我国华北五省市区的丧偶人数按性别分为: 表4-3 1996年华北地区丧偶情况统计 男 女 合 计 北 京 112 356 478 天 津 130 305 435 河 北 846 1787 2633 山 西 359 782 1141 内蒙古 291 558 849 合 计 1748 3788 5536 检验在丧偶数量上性别因素和地区因素是否独立。 三、在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三

文档评论(0)

chqs52 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档