网站大量收购独家精品文档,联系QQ:2885784924

四、首都师范大学 简单统计推断-参数估计1.ppt

四、首都师范大学 简单统计推断-参数估计1.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四、首都师范大学 简单统计推断-参数估计1

* 第四章 简单统计推断1 总体参数的估计 总体参数的估计 ?人们每时每刻都在做估计。出门根据天色云量等估计今天的天气、根据望闻问切来估计病人的病情、根据外表估计一个人的身高体重、根据前几天的数据估计今天的股市行情、根据营业数据等估计一个公司的业绩等等。 ?估计就是根据你拥有的信息来对现实世界进行某种判断。统计中的估计也不例外,它是完全根据数据做出的。 总体参数的估计 例如:人们想知道到底有多大比例的北京人同意北京大力发展轨道交通; 由于不大可能询问所有的一千多万北京市民,人们只好进行抽样调查以得到样本,并用样本中同意发展轨道交通的比例来估计真实的比例。 从不同的样本得到的结论也不会完全一样。 虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。 总体参数的估计 从数据得到对现实世界的结论的过程就叫做统计推断(statistical inference)。 这个调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是下一章要引进的假设检验(hypothesis testing)。 总体参数的估计 ?因此本章内容就是由样本数据对总体参数进行估计,即: 均值 均值 ?由样本 标准差 总体 标准差 统计量 比例 p 参数 比例 P (成数) (成数) 估计 基本概念:样本容量及样本个数 ?样本容量:指一个样本所包含的单位数。 ?一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。 ?样本个数:又称样本可能数目,是指从一个总体中可能抽取多少个样本。 基本概念:重置抽样与不重置抽样 ?重置抽样:是指在抽取样本单位的时候每次只抽取一个样本单位,观察记录之后再放回到总体中参加下一次的抽样,这样在抽样的过程中总体单位总数始终不变。 ?一般来说,用不重置的方法,从总体中,抽取样本容量为n的可能样本数为: ? 基本概念:重置抽样与不重置抽样 ?不重置抽样:是指在抽取样本单位的时候每次只抽取一个样本单位,观察记录之后不再放回到总体中参加下一次的抽样,这样在抽样的过程中总体单位总数始终在减少。 ?用不重置的方法,从总体中,抽取样本容量为n的可能样本数为: 基本概念:抽样误差 ?抽样误差:就是指按照随机原则抽样时,在没有登记误差的条件下样本指标与总体指标之间存在的误差。 ?主要包括: 总体平均数和样本平均数的误差 总体成数和样本成数的误差 基本概念:抽样平均误差 ?为什么要研究抽样平均误差? 未知 ?实际误差未知: ?即使知道,由于样本均值是随机的,每次的误差也不一样。 基本概念:抽样平均误差 ?抽样平均误差:是指所有可能组成的样本的抽样指标与总体指标的平均误差程度。 ?以均值为例: ? 因此,抽样平均误差就是样本均值的标准差,即我们在前面介绍过的标准误差。 基本概念:抽样平均误差 ?平均数的抽样误差: ?重置抽样 ? ? ? ?不重置抽样 总体参数的估计 ?由样本统计量来估计总体参数有两种方法:点估计和区间估计 ?点估计(point estimation):也就是用样本统计量的实现值来近似相应的总体参数。 即: 区间估计(interval estimation):它是包括样本统计量在内(有时是以统计量为中心)的一个区间;该区间被认为很可能包含总体参数。 样本均值的分布 ?并且不管我们研究的总体是否服从正态分布,样本均值一定服从正态分布。 ?同前面我们介绍的正态分布的性质一样: ? ? 样本均值 在总体均值 一个正负标准差的区间内的概率为68.27%。 样本均值在总体均值两个正负标准差的区间内的概率为95.45%。 样本均值在总体均值三个正负标准差的区间内的概率为99.37%。 1 68.27% 2 95.45% 3 99.37% 样本均值的分布 ?同样我们可对样本均值的正态分布进行标准化: 总体参数的估计 ?我们将Z称为概率度,将它对应的概率称为置信度(confidence level),将 表示的范围称为置信区间(confidence in

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档