统计学 第四章 抽样推断(1).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计推断的过程 抽样推断的基本概念 (四)重复抽样与不重复抽样 1.重复抽样:重复抽样(或重置抽样)是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮抽样。 重复抽样的特点 重复抽样的特点: 第一,n个单位构成的样本是n次试验的结果。 第二,每次试验是独立的,即其试验的结果与前次、后次的结果无关。 第三,每次试验是在相同条件下进行的,每个单位在每次试验中选中的机会(概率)是相同的。 在重复试验中,样本可能的个数是考虑顺序Nn,N为总体单位数,n为样本容量。 不考虑顺序则样本个数为: 2.不重复抽样:不重复抽样亦称为不重置抽样,即每次从总体抽取一个单位,登记后不放回原总体,不参加下一轮抽样。下一次继续从总体中余下的单位抽取样本。 其特点是:n个单位的样本由 n 次试验结果构成,但由于每次抽出不重复,所以实质上相当于从总体中同时抽取n个样本单位。 如果考虑顺序,其样本可能个数为 ; 如果不考虑顺序,其样本可能个数为 总体参数和样本统计量 总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 样本统计量:根据样本分布计算的指标。是随机变量。 总体与样本比较 总体与样本比较 总体与样本比较 第二节 抽样分布 抽样分布:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。 一、重复抽样分布 正态总体样本平均数的分布 所以,由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布 这是一个非常重要的结论,有广泛的应用。 (可参见中心极限定理) (三)抽样平均误差公式证明 1.抽样平均误差 反映样本平均数与总体平均数误差水平的一般水平. 数值等于样本平均数的标准差 . 样本平均数的标准差 可以证明,重置抽样下, 不重置抽样下, 其中,N为总体单位数 ,n为样本单位数, M为样本容量, 置信水平(置信度) 1.总体未知参数落在区间内的概率 2.表示为 (1 - ???? ??为显著性水平,是总体参数未在区间内的概率? 3.常用的置信水平值有 99%, 95%,90% 相应的 ??为0.01,0.05,0.10 四、大数定理与中心极限定理 (一)大数定理 大数定理又称作大数法则。人们在观察个别事物时,是连同一切个别的特性来观察的。个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。 (二)中心极限定理 1.正态分布的再生定理 相互独立的两个正态随机变量相加之和仍服从正态分布,这就是正态分布的再生性。因此,从服从正态分布的总体中抽出一个容量是n 的样本,则样本平均数 也服从正态分布。如果总体的平均是 ,标准差是 ,则样本平均数所服从的正态分布的中心仍是 ,标准差是抽样平均误差 2.中心极限定理 总体参数估计概述 设待估计的总体参数是θ,用以估计该参数的统计量是 ,抽样估计的极限误差是Δ,即: 极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。 参数估计的两个要求: 精度:估计误差的最大范围,通过极限误差来反映。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。 可靠性:估计正确性的一个概率保证,通常称为估计的置信度。 参数估计的方法 点估计的方法 1.最大似然法 ⑴定义 最大似然法(Maximum Likelihood,ML)是一种具有理论性的点估计法,此方法的基本思想是:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大,而不是像最小二乘估计法旨在得到使得模型能最好地拟合样本数据的参数估计量。 最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。这个方法最早是遗传学家以及统计学家罗纳德·费雪爵士在 1912 年至1922 年间开始使用的。 最大似然法明确地使用概率模型, 其目标是寻找能够以较高概率产生观察数据的系统发生树。 最大似然法是一类完全基于统计的系统发生树重建方法的代表。该方法在每组序列比对中考虑了每个核苷酸替换的概率。 例如,转换出现的概率大约是颠换的三倍。在一个三条序列的比对中,如果发现其中有一列为一个C,一个 T和一个 G,我们有理由认为,C和 T所在的序列之间的关系很有可能更接近。由于被研究序列的共同祖先序列是未知的,概率的计算变得复杂;

文档评论(0)

today-is-pqsczlx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档