网站大量收购独家精品文档,联系QQ:2885784924

11-A阶段统计推断.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计推断的概要 1. 统计推断 2. 误差的来源 3. 置信区间 主要内容 1. 统计推断 统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结果 推测出“总体可能是这样”结论,对总体下一个正确判断的行为,即总体 是否发生了变动。而且,一般以推测总体平均值,总体的比率,总体标 准偏差等显示总体分布特征值的统计程序称为统计推断。 总体 样本 样本 样本 对数据的 统计处理 统计推断 信息分析 对事件的结论 措施及行动 因此我们要注意的是:观察样本并非为得到样本的信息,其目的在于通过样本分析,得到总体的信息,并对总体下恰当结论,采取相应措施。 点推断与区间推断 当我们不知道的总体的特征值,我们可以利用样本推断总体的方法有两种. ■ 点推断: 推断为一个值 例) 平均,标准偏差,方差, 中位数,,,,, 但是点推断值中没有误差的概念。 即,无法知道样本中求出的推断值是否接近总体的真值。 ■ 区间推断: 推断总体可能包括的期望区间 例)置信区间,置信水平 区间推断是完善点推断的短处,在点推断值上包括误差概念。 是否还记得基础统计学中讲到总体和样本的知识? Stat Basic Statistics Display Descriptive Statistics 利用图表分析方法中学习的上述菜单,在MINITAB中求点推断值与区间推断值。 对总体的点推断值 -平均,标准偏差 -分散 -斜型,尖度 -最小,最大, Median -四分位数 对总体区间推断值 95%置信度总体平均值 的置信区间 -95%置信度下总体标准 偏差的置信区间 -95%置信度总体中位 数的置信区间 不管大家观察的数据是一个测定值或统计推断的结果,都有可能是错误的. 这是因为我们在总体中抽取样本的时候,希望观测值(平均,标准偏差…)是与总体的特性值相同,但大部分都会发生一定的差异.有时这种差异会引起错误的统计推断. 2. 误差产生的来源 总体 样本 1 样本误差 误差的根源 : 样本误差 / 样本偏移(层别)/测定误差/测定妥当性 从总体任意取出样本的差异 引起的误差 样本 2 样本 3 总体 样本 1 样本 样本2 样本3 样本的层别错误造成偏向一侧,因 样本选定引起的误差 包括样本层别错误 统计只能涉及样本误差,其它误差的根源应用其它解决方法 对某一个问题,为了分析现象,假设抽取了几个样本 - 从总体抽取的样本的观测值(平均,标准偏差…)是否相同? - 样本的大小变化时发生什么? 为加深大家的理解,做一下实习. 样本误差 由1000个组成的样本保存在“数据”变量. Calc Random data Normal Calc Random data Sample from columns… 从总体中随机抽取的5个观察 值和30个观察值.然后反复进行 4次样本收集程序 现在求上述标本的点推断值 利用MINITAB的 Basic Statistics求标本的统计量. 注意计算的各个统计量具有相当的差异,确认因样本的大小的平均,标准偏差的差异,并说明理由 从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确. 样本容量大小对推断值的影响 观察一下样本容量大小对推断(对均值的推断)有什么样的影响? 样本容量越大,平均值的推断分散越小,推断的精确度越高。 n=30时平均的理论分布 n=2时平均的理论分布 ? 样本均值的分布 平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好. 随样本容量变化的平均标准误差(平均值的标准偏差) 样本大小 = n 样本的标准偏差 平均的标准误差 = = x x S S 弯曲点 标 准 误 差 10 0 20 30 标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上. n=2时的理论分布 95% 置信区间 95% 置信区间 总体的分布 n=30时的理论分布 区间推断与点推断相比是引用误差概念的统计推断法,推断出总体特征值 (平均、方差、比率)在什么范围之内,可以用置信区间来表示. 置信度或样本容量变化,推断的值的范围也会发生变化. 我们通过置信区间的计算就可以断定研究的变量“X”是否发生了变动?从 而确定它是否

文档评论(0)

caijie1982 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档