【清华】05-环境数据分析方法-3-838507025.pptxVIP

【清华】05-环境数据分析方法-3-838507025.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

环境数据处理与数学模型

环境数据分析方法;01;05;04;大样本与小样本

判断依据

大样本:n30(社会学研究中往往要求大于50)

小样本:n30

本质区别

;原假设与备择假设

原假设(Nullhypothesis)

研究者想收集证据予以反对的假设,H0

备择假设/研究假设(Alternativehypothesis)

研究者想收集证据予以支持的假设,H1;单尾检验与双尾检验

单尾检验(One-tailedtest)

备择假设具有特定的方向性,即含有>或<的假设检验

双尾检验(Two-tailedtest)

备择假设不具有特定的方向性,即含有≠的假设检验;两类错误与显著性水平

假设检验的目的是要根据样本信息作出决策,但决策是建立在样本信息基础上的,而样本又是随机的,很有可能犯错;两类错误与显著性水平

增大样本会受限制,所以只能将α和β控制在可接受的范围内

哪一类错误的后果更为严重,首要控制哪类错误发生的概率

犯第I类错误的概率可以控制,往往先控制第I类错误发生的概率

假设检验中犯第I类错误的概率,称为显著性水平(Levelofsignificance),记为α;两类错误与显著性水平

显著性水平使人们事先指定的犯第I类错误概率α的最大允许值

α=0.01,0.05,0.1

确定α后,第II类错误发生的概率β没法确定

在样本观测没有充分理由拒绝原假设时,我们通常称“不拒绝H0”,而不称“接受H0”,因为“接受H0”的可靠性将由概率β来控制,相对复杂;检验统计量与拒绝域

样本能够提供的信息十分丰富,往往需要对这些信息进行压缩和提炼

检验统计量(Teststatistic):根据样本观测结果计算得到的,能够对原假设与备择假设作出决策的某个统计量

检验统计量是一个随机变量,随着样本的不同,它的具体数值也不同

根据检验统计量建立一个准则,依据这个准则和计算得到的检验统计量,决定是否拒绝原假设;检验统计量与拒绝域

拒绝域(Rejectionregion):能够拒绝原假设的检验统计量的所有可能取值集合

由显著性水平α所谓围成的区域

α越小,拒绝域越小

如果样本计算得到的检验统计量落在了拒绝域里,就拒绝原假设

临界值(Criticalvalue):根据给定的显著性水平确定的拒绝域的边界值;;假设检验的步骤

陈述原假设H0和备择假设H1

从所研究的总体中抽出一个随机样本

确定一个适当的检验统计量,并利用样本数据计算出其具体数值

确定一个适当的显著性水平α,并计算出临界值,制定拒绝域

将统计量的值与临界值比较,作出决策:若统计量的值落在拒绝域里,拒绝原假设(也可以用P值作出决策);两总体均值一致性检验

例如:

两个班平均成绩是否有显著性差异?

两个端面TN浓度是否有显著性差异?;大样本两总体均值一致性检验

两个样本的均值抽样分布为正态分布,两个样本均值之差也为正态分布

计算参数

总体A,总体均值、总体方差:

总体B,总体均值、总体方差:

来自总体A的样本,样本均值、样本方差和样本容量:

来自总体B的样本,样本均值、样本方差和样本容量:

;统计检验步骤;例2:某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录了两个样本的均值、方差等,如下表,在显著性水平0.05的条件下,能否认为男性职员和女性职员的平均小时工资存在显著差异?;设μA=男性职员的平均小时工资,μB=女性职员的平均小时工资。

原假设与备择假设分别为:

H0:μA-μB=0;H1:μA-μB≠0

计算统计量:(由于不知道总体方差,用样本方差代替);小样本两总体均值一致性检验

两个样本的总体均要服从正态分布

总体服从正态分布,且两个总体方差已知

计算参数

总体A,满足正态分布

总体B,满足正态分布

来自总体A的样本,样本均值和样本容量:

来自总体B的样本,样本均值和样本容量:

总体方差已知

;统计检验步骤;小样本两总体均值一致性检验

总体服从正态分布,两个总体的方差未知,但相等

需要用两个样本的方差对总体方差估计

将两个样本合在一起,给出总体方差的合并估计量

计算参数

总体A,满足正态分布

总体B,满足正态分布

来自总体A的样本,样本均值、方差、容量:

来自总体B的样本,样本均值、方差、容量:

总体方差未知

;统计检验步骤;小样本两总体均值一致性检验

总体服从正态分布,两个总体的方差未知,且不相等,但两个样本的容量相等

两个样本均值之差经标准化后服从t分布

计算参数

总体A,满足正态分布

总体B,满足正态分布

来自总体A的样本,样本均值、方差、容量:

来自总体B的样本,样本均值、方差、容量:

总体方差未知且不等

两个样本容量相等

;统计检验步骤;小样本两总体均值一致性检验

总体服从正态分布

文档评论(0)

clevercatty + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档