总体分布-统计学.ppt

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 抽样估计 明确抽样推断的含义、特点和作用。了解有关的基本概念,重点掌握抽样误差的含义、影响因素及其计算。 了解抽样估计的基本方法和步骤;抽样方案设计的基本原则。全面掌握简单随机抽样的平均误差计算方法和样本容量确定方式,了解其它各种抽样组织方式的含义及平均误差的计算。 抽样估计的过程 第一节 抽样分布 是以样本观测结果去估计未知的总体数量特征。 例:2008年4月18日,上证综合指数再创本年新低,达到3094.67点,在上证A股上市的878家企业中,55家上涨,823家下跌.请估计当天个股的平均涨幅. 某商场化妆品柜台共500种产品,其中合格品480件,不合格品20件,要求计算不合格品的成数、标准差和标准差系数。 1.样本分布:就是样本中所有个体关于某个变量(标志)的取值所形成的分布。 同一变量不同的样本或同一样本不同的变量,其分布是不同的。 例2:如果我们选择奥运板块的个股作为样本。则样本分布为该板块60只股票在4月18日的涨跌情况 1. 样本容量是指一个样本所包含的单位数。通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。 随着样本容量的增大,样本对总体的代表性越来越高,样本值接近总体值。 可能样本数目的计算公式 (四)抽样分布及其特征 1.抽样分布的概念 抽样分布,是样本统计量的概率分布,由样本统计量的所有可能取值和与之相应的概率组成。  某车间班组5个工人日工资为34,38,42,46,50元,则总体工人日平均工资 A.用重复抽样方法(考虑顺序) 从5个工人(日工资为34,38,42,46,50元)中随机抽取2人构成样本,共52=25个样本 所有可能样本及其平均数: 样本均值抽样分布的形式 抽样分布与总体分布的关系 抽样分布与总体分布的关系 结论: (1)样本均值抽样分布的期望值(均值): 在重复或不重复抽样下,都等于总体均值 (2)样本均值抽样分布的方差: 重复抽样方差大于不重复抽样 在各种抽样方法和抽样组织方式下,样本统计量的数学期望都等于总体参数。 抽样分布的特征主要通过方差来体现。 抽样分布越集中、样本统计量的方差越小,则样本统计值越可能接近总体参数真值,抽样估计的误差越小、估计结果就越精确。 二、抽样分布定理 (一)样本均值的抽样分布定理 1.正态分布的再生定理 若总体服从正态分布 则样本均值 也服从正态分布 正态分布是最重要、最常用的抽样分布,由于抽样一般都是大样本,因此可以根据正态分布理论,根据样本统计值来推断总体参数。 统计的迷局—对话郎咸平 一、抽样中的误差构成 二、抽样误差的表现形式 ①实际抽样误差 重复抽样 落在总体均值某一区间内的样本 (2)区间估计,是指用一个具有一定可靠程度的区间范围来估计总体参数。 区间估计 基本要求 统计学中的盐:一个经典的参数估计 1947年印度刚独立,德里就发生了一些公共暴乱。一个少数民族团体中的大多数人避难到被称为红色堡垒的地方,这是一个被保护的区域,少部分人逃到另一个地区的修姆因庙里。政府有责任提供食物给这些避难者。这个任物委托给了承包商,由于没有任何关于避难者人数的信息,政府被迫接受和付出承包商所提出的为避难者所购买的各种日用品和生活保证品的账单。政府的这项开支看起来非常大,因而有人建议让统计学家(他们能计算)来求出红色城堡中避难者的正确人数。 摆在统计学家面前的问题是:在没有任何避难者人数的先验信息、没有任何机会直接了解那个地区人口密度的情形下,同时在不能使用任何已知的用于估计或人口统计调查中的抽样技术条件下,来估计一个给定地区的人口数量。 统计学中的盐 专家们不得不想出某个办法来解决这个问题。这些账单记录了提供给避难者的不同的生活用品,如所购入的米、豆类和盐。如何利用这些资料呢? 假设全体避难者一天所需要的米、豆类和盐的总量分别为R,P,S。由消费调查,每人每天所需要这些食物的量分别为r, p, s。因而R/r, P/p, S/s,提供了一个集团中相同人数的平行估计量,也就是说,这三个值无论哪一个均是等价有效的。专家们利用承包商提出的R,P,S计算了这些值,发现S/s最小,而表示大米的R/r最大。与盐相比,商品中最贵的大米的量有可能被夸大了(当时在印度盐的价格非常低,因而不会夸大盐的用量)。因此,统计学家提出估计

文档评论(0)

daoqqzhuan3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档