- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
均值比较与均值比较的检验过程 均值比较的概念 统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:均值不相等的两组样本不一定来自均值不同的总体。 能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。 6.1 参数检验概述 6.1.2 假设检验的基本问题 1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立; 2.采用逻辑上的反证法,依据统计上的小概率原理。 6.2 MEANS 过程 功能:分组计算、比较指定变量的描述统计量。包括均值、标准差、总和、观测数、方差等等,还可以给出方差分析表和线性检验结果。 Analyze- Compare Means-Means Dependent List:用于选入需要分析的变量,如果选入两个以上变量,系统会在同一张输出表中依次给出分析结果。 Layer :用于选入分组变量,如果选入两个以上的变量,系统会根据layer的设置情况作出不同的反应。 Options子对话框:用于选择需要计算的描述统计量和统计分析。 Statistics框:可选的描述统计量;cell ststistics:选入的描述性统计量 Statistics for first layer复选框:用于选择是否检验第一层的分组变量对结果变量的影响有无统计意义。Anova table and eta:对分组变量进行单因素方差分析,用于度量分组变量和结果变量间的关联性。Eta平方表示由组间差异所解释的结果变量的方差的比例。Test for linearity:检验线性相关性,即不同组的均值间是否存在线性趋势。当分组变量为数值型变量时系统自动进行线性相关性检验。 6.3 单样本的T检验 6.3.1检验目的: 检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。 要求样本来自的总体服从或近似服从正态分布。 总体均值的检验 总体均值的检验(?2 已知或?2未知、大样本) 1.假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n?30) 2.使用Z-统计量 ?2 已知: ?2 未知: 总体均值的检验 (?2未知小样本) 1. 假定条件 总体为正态分布 ?2未知,且小样本 2. 使用t 统计量 6.3.2 单样本T检验的实现思路 提出原假设: 计算检验统计量和概率P值 给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。 6.3.3 单样本t检验的基本操作步骤 1、选择选项Analyze-Compare means-One-Samples T test,出现窗口: 2、在Test Value框中输入检验值。 3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Exclude cases listwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。 至此,SPSS将自动计算t统计量和对应的概率p值。 练习 根据各保险公司人员构成情况数据,对我国目前保险公司从业人员的受高等教育的程度和年轻化的程度进行推断: 保险公司具有高等教育水平的员工比例的平均值不低于0.8; 年轻人比例的平均值与0.5无显著差异。 6.4 两独立样本的T检验 6.4.1 两独立样本T检验的目的 利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异; 两独立样本的样本容量可以相等,也可以不相等; 样本来自的总体服从或近似服从正态分布。 两个独立样本之差的抽样分布 两个总体均值之差的检验 (?12、 ?22 已知) 1.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布,
文档评论(0)