- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 统计推断.ppt
第六章 统计推断 第一节 统计推断及其特点 第二节 参数估计 第三节 假设检验 第一节 统计推断及其特点 一、统计推断的概念及其特点 概念 统计推断是在抽样调查的基础上,根据从总体中抽取的部分样本资料计算样本值,然后用样本的估计值对总体参数做出具有一定可靠程度的估计和判断,从而反映总体数量特征和分布的一种方法。 统计推断的特点 按照随机原则从总体中抽取样本单位; 随机原则是指在抽取样本时,排除主观意识地抽取调查单位,使每个单位都有一定的机会(概率)被抽中,因此也叫概率抽样。 其目的是由部分信息来推断总体特征; 其理论基础是概率论; 其误差事先可以计算并加以控制。 二、统计推断的基本方法 1、参数估计——研究如何利用样本统计量来推断总体未知参数的方法。 2、假设检验(参数检验)——事先对总体参数提出一个假设,然后再利用样本信息去检验这个假设是否成立的一个过程。 三、统计推断的误差 概念: 统计推断的误差是指样本数据与总体真实值之间的差距. 分类: 抽样误差与非抽样误差 1、抽样误差 概念 抽样误差也称随机误差,是指由于抽样的随机性引起的样本结果与总体真值之间的误差。 抽样误差不是指某个具体的样本观测值与总体真值之间的差距,而是指样本的所有可能结果与总体真值之间的平均性差异,因此,也叫抽样平均误差。 抽样误差的计算 在简单随机抽样条件下,样本均值和样本 比例的抽样误差: 样本均值的抽样误差 样本比例的抽样误差 影响抽样误差的因素 总体各单位标志值的差异程度,即,差异程度越大,则抽样误差愈大,反之,则愈小; 抽样方法。不同的抽样方法,抽样误差也不同。一般情况下,重复抽样误差比不重复抽样误差要大一些; 抽样调查的组织形式。 注:①不同的抽样组织形式有不同的抽样误差; ②抽样误差是一种随机性误差,只存在于概率抽样中 。 2、非抽样误差 概念 非抽样误差是指除抽样误差之外,由于其他原因引起的样本观测结果与总体真值之间的差异。 非抽样误差存在于各种抽样和调查中。 非抽样误差的影响因素 (1)抽样框因素 ;(2)回答因素; (3)无回答因素 ;(4)调查员的因素; (5)测量因素 。 注:非抽样误差从理论上可以避免,但实际上很难控制。 第二节 参数估计 一、参数估计概述 1、参数估计——根据样本统计量来估计总体参数的一种方法 。 2、估计量——用于估计总体参数的统计量的名称。 3、估计值——根据一组具体样本计算出的估计量的取值。 二、参数估计的方法 (一)点估计 1、定义:点估计是指用样本统计量的某个取值直接作为总体参数的估计值。例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 无法给出估计值接近总体参数程度的信息 虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 (1)无偏性:估计量抽样分布的数学期望等于被估计的总体参数 评价估计量的标准 评价估计量的标准 (3)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数 3、点估计的优缺点 (1)优点:其一是简洁明了;其二是能提供具体的估计值。 (2)缺点:其一是无法提供误差情况;其二是估计的可靠程度无从知晓。 (二)区间估计 相关概念 1、区间估计——给出总体参数的一个区间范围,并在抽样分布的基础上给出估计的可靠性度量。 2、置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 , 对给定的常数 , 及任意的 , 有 , 则称随机区间 是置信度(置信水平)为 的置信区间(区间估计)。其中 分别为置信下限和置信上限。 反映了估计的精度大小。 置信区间越窄,则估计精度越高。 区间估计的图示 3、置信度,或者称作置信系数或置信水平,是指置信区间中包含总体参数真值的可能性大小,也就是人们可以信赖的程度,通常用 表示。反映的是估计的可靠度,置信水平越大,则估计的可靠度越高。 另外,置信度也可以指重复抽样条件下,在构造的所
文档评论(0)