- 1、本文档共129页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5抽样分布与参数估计(修改稿)
第 五 章 抽样分布与参数估计 第一节 抽样调查的基本概念与方法 一、抽样调查的概念和作用 二、抽样调查中的几个基本概念 二、抽样调查中的几个基本概念 三、抽样方法有二种 第二节 抽样分布 (sampling distribution) 样本统计量的概率分布(频率分布) 是一种理论概率分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution) 一、样本均值的抽样分布 样本均值的抽样分布(例题分析) 样本均值的抽样分布 (例题分析) 样本均值的抽样分布 (例题分析) 样本均值的分布与总体分布的比较 (例题分析) 样本均值的抽样分布(数学期望与方差) 样本均值的数学期望 样本均值的方差 重复抽样 不重复抽样 均值的抽样标准误 所有可能的样本均值的标准差,测度所有样本均值的离散程度 小于总体标准差 计算公式为 二、样本比例的抽样分布 样本比例的抽样分布(数学期望与方差) 样本比例的数学期望 样本比例的方差 重复抽样 不重复抽样 第三节 正态分布和正态逼近 一、正态分布 f(x) = 随机变量 X 的频数 ? = 正态随机变量X的均值 ? ?= 正态随机变量X的方差 ? = 3.1415926; e = 2.71828 x = 随机变量的取值 (-? x ?) 正态分布的概率 二、标准正态分布(standardize the normal distribution) 随机变量具有均值为0,标准差为1的正态分布 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布 标准正态分布 标准正态分布表的使用 为了应用上的方便,是将z从0—5的概率编成正态分布表,直接查表求得概率。 对于标准正态分布,即Z~N(0,1),有 P (a? Z?b)? ? ?b? ?? ?a? P (|Z| ?z)? 对于负的 z ,可由? (-z)???? ?z?得到 对于一般正态分布,即X~N(? , ? ),有 常用的概率分布表 在统计推断中,常常要求变量落在(-z,z)区间的概率,即:P (|Z| ?z)? 2? ?z? ?1 常用的概率分布表 标准化的例子 P(5 ? X ? 6.2) 标准化的例子P(2.9 ? X ? 7.1) 正态分布(例题分析) 三、关于正态分布的定理(一)正态分布再生定理 (二)中心极限定理(central limit theorem) 样本比例的抽样分布 总体比例是服从0—1分布。因此中心极限定理也适用于样本比例的分布。具体说,从任一总体比例为 、方差为 的0—1分布总体中,抽取容量为n的样本,其样本比例p的分布随着样本单位数n的增大而趋近于平均数 方差 的正态分布。 在实际工作中,总体变量的分布通常是不知道的,样本平均数或比例的分布是否接近于正态,可接近到什么程度,取决于样本容量。样本容量越大,样本平均数或比例的分布也越接近正态。一般认为样本单位数不少于30的是大样本,抽样分布就接近于正态分布。 四、样本方差的抽样分布 ?2分布(性质和特点) 分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(?2)=n,方差为:D(?2)=2n(n为自由度) 可加性:若U和V为两个独立的?2分布随机变量,U~?2(n1), V~?2(n2),则U+V这一随机变量服从自由度为n1+n2的?2分布 c2分布(图示) 参数估计在统计方法中的地位 统计推断的过程 二、点估计1、概念 二、点估计2、优良估计量的三个标准 ②一致性 ③有效性 二战中的点估计— 德军有多少辆坦克? 二战期间,盟军非常想知道德军总共制造了多少辆坦。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编号则是样本。 假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表
文档评论(0)