第5章统计量及其分布011.7.28.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 统计量及其分布   【考试要求】   5.1 总体与样本   总体   样本   5.2 样本的分布与数值特征   样本数据的整理与显示   样本的数值特征   5.3 统计量与抽样分布   统计量的概念   抽样分布   与正态总体有关的抽样分布   【要点详解】      §5.1 总体与样本   1.总体   总体:在数理统计中研究对象的全体。   个体:构成总体的每一个成员。   注:由于每一项统计研究通常关心的是总体和个体的某个(或多个)特定的数量指标,所以,在具体的研究案例中通常用对应的数量指标表示总体和个体。   数理统计的研究目的就是想了解总体X的分布特征和统计规律。      【例题5.1】要了解某市工业企业生产设备情况,则总体是(  )。   A.该市全部工业企业  B.该市重点工业企业   C.该市重点工业企业的每一台设备  D.该市工业企业的全部生产设备   E.该市工业企业的每一台设备的运转情况   【答案】D   【解析】在数理统计中将研究对象的全体称为总体,构成总体的每一个成员称为个体。要了解某市工业企业生产设备情况,则统计总体应该为该市工业企业的全部生产设备。   2.样本   样本:从总体中抽取部分个体组成的集合。   样品:样本中所含的个体。   样本容量:样本中样品的个数。   获取样本的方法可以分为两大类:概率抽样和非概率抽样。   概率抽样(简单随机抽样)的特征   ①独立性   样本中每一个样品的取值不受其他样品取值的影响,即X1,X2,…,Xn相互独立。   ②同分布   每一个个体入选样本的机会等于它在总体中出现的概率,即每一个样本Xi与总体X具有相同的分布。   根据这两个特征,概率抽样所获得的样本也称为独立同分布样本。简记为:   其中:F(x)为总体分布,X1,X2,…,Xn为样本容量为n的随机样本,i.i.d.表示独立同分布。   在一次抽样中具体抽到的观察值,通常记作:   x1,x2,…,xn   x1,x2,…,xn称为X1,X2,…,Xn的观察值,或简称为样本观察值。   【例题5.2】对某家公司进行审计,该公司年度内的所有发票是55400张,审计人员从中随机抽查了100张发票进行审查,发现有2张发票有差错,则样本容量是(  )。   A.2  B.98  C.100  D.55400  E.55300   【答案】C   【解析】该题中总体是55400张发票,样本是100张发票。样本容量是100。   §5.2 样本的分布与数值特征   1.样本数据的整理与显示   (1)频数统计与频率分布   ①离散随机变量   频数:如果总体X是离散随机变量,其可能的取值为a1,a2,…,ak,统计样本观察值x1,x2,…,xn中取到ai的个数,记作ni,i=1,2,…,k。   频率:ai的频数ni除以样本容量n,记作fi   根据频数统计表或频率分布表做条形图。条形图的横轴为样本数据的取值,纵轴为该取值的频数或频率。   ②连续随机变量   如果总体X是连续随机变量,其可能的取值不可能一一列举,这时数据整理的一般方法是进行分组统计,将其可能取值分成k个小区间:[a0,a1),[a1,a2),…,[ak-1,ak),统计样本观察值x1,x2,…,xn落在每一个小区间的频数ni,并计算相应频率fi,i=1,2,…,k   根据频率分布表可以做直方图。直方图的横轴为样本数据的取值,纵轴为该取值的频数或频率。和条形图不同的是,直方图条块之间没有空隙,它是以直方的面积表示取值概率,而条形图只是以直方的高度表示取值概率。样本直方图近似反映了总体的概率分布情况。   (2)样本经验分布函数   经验分布函数:设总体X的分布函数为F(x),从中获得的样本观察值为x1,x2,…,xn,将样本观察值从小到大排列,构成次序观察值x(1),x(2),…,x(n),令   则称Fn(x)为该样本的经验分布函数。   2.样本的数值特征   常用的样本数值特征可以分为三大类:   ①分布的集中趋势测量值,反映各数据向中心值靠拢或聚集的程度;   ②分布的离散程度测量值,反映各数据远离其中心值的趋势;   ③分布的形状测量值,反映数据分布的偏斜和耸立程度。   (1)反映中心趋势的样本特征值   集中趋势:一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。   常用的中心趋势特征值有三个:样本均值、样本中位数和样本众数。   ①样本均值   样本均值:一组数据加权平均的结果,通常记作 。   ?简单平均数   如果样本数据为点数据x1,x2,…,xn,则均值为简单平均数   ?加权平均值   如果样本数据为区间数据,假设各区间的组中值为xi ,各组频数

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档