- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 统计量及其分布 【考试要求】 5.1 总体与样本 总体 样本 5.2 样本的分布与数值特征 样本数据的整理与显示 样本的数值特征 5.3 统计量与抽样分布 统计量的概念 抽样分布 与正态总体有关的抽样分布 【要点详解】 §5.1 总体与样本 1.总体 总体:在数理统计中研究对象的全体。 个体:构成总体的每一个成员。 注:由于每一项统计研究通常关心的是总体和个体的某个(或多个)特定的数量指标,所以,在具体的研究案例中通常用对应的数量指标表示总体和个体。 数理统计的研究目的就是想了解总体X的分布特征和统计规律。 【例题5.1】要了解某市工业企业生产设备情况,则总体是( )。 A.该市全部工业企业 B.该市重点工业企业 C.该市重点工业企业的每一台设备 D.该市工业企业的全部生产设备 E.该市工业企业的每一台设备的运转情况 【答案】D 【解析】在数理统计中将研究对象的全体称为总体,构成总体的每一个成员称为个体。要了解某市工业企业生产设备情况,则统计总体应该为该市工业企业的全部生产设备。 2.样本 样本:从总体中抽取部分个体组成的集合。 样品:样本中所含的个体。 样本容量:样本中样品的个数。 获取样本的方法可以分为两大类:概率抽样和非概率抽样。 概率抽样(简单随机抽样)的特征 ①独立性 样本中每一个样品的取值不受其他样品取值的影响,即X1,X2,…,Xn相互独立。 ②同分布 每一个个体入选样本的机会等于它在总体中出现的概率,即每一个样本Xi与总体X具有相同的分布。 根据这两个特征,概率抽样所获得的样本也称为独立同分布样本。简记为: 其中:F(x)为总体分布,X1,X2,…,Xn为样本容量为n的随机样本,i.i.d.表示独立同分布。 在一次抽样中具体抽到的观察值,通常记作: x1,x2,…,xn x1,x2,…,xn称为X1,X2,…,Xn的观察值,或简称为样本观察值。 【例题5.2】对某家公司进行审计,该公司年度内的所有发票是55400张,审计人员从中随机抽查了100张发票进行审查,发现有2张发票有差错,则样本容量是( )。 A.2 B.98 C.100 D.55400 E.55300 【答案】C 【解析】该题中总体是55400张发票,样本是100张发票。样本容量是100。 §5.2 样本的分布与数值特征 1.样本数据的整理与显示 (1)频数统计与频率分布 ①离散随机变量 频数:如果总体X是离散随机变量,其可能的取值为a1,a2,…,ak,统计样本观察值x1,x2,…,xn中取到ai的个数,记作ni,i=1,2,…,k。 频率:ai的频数ni除以样本容量n,记作fi 根据频数统计表或频率分布表做条形图。条形图的横轴为样本数据的取值,纵轴为该取值的频数或频率。 ②连续随机变量 如果总体X是连续随机变量,其可能的取值不可能一一列举,这时数据整理的一般方法是进行分组统计,将其可能取值分成k个小区间:[a0,a1),[a1,a2),…,[ak-1,ak),统计样本观察值x1,x2,…,xn落在每一个小区间的频数ni,并计算相应频率fi,i=1,2,…,k 根据频率分布表可以做直方图。直方图的横轴为样本数据的取值,纵轴为该取值的频数或频率。和条形图不同的是,直方图条块之间没有空隙,它是以直方的面积表示取值概率,而条形图只是以直方的高度表示取值概率。样本直方图近似反映了总体的概率分布情况。 (2)样本经验分布函数 经验分布函数:设总体X的分布函数为F(x),从中获得的样本观察值为x1,x2,…,xn,将样本观察值从小到大排列,构成次序观察值x(1),x(2),…,x(n),令 则称Fn(x)为该样本的经验分布函数。 2.样本的数值特征 常用的样本数值特征可以分为三大类: ①分布的集中趋势测量值,反映各数据向中心值靠拢或聚集的程度; ②分布的离散程度测量值,反映各数据远离其中心值的趋势; ③分布的形状测量值,反映数据分布的偏斜和耸立程度。 (1)反映中心趋势的样本特征值 集中趋势:一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。 常用的中心趋势特征值有三个:样本均值、样本中位数和样本众数。 ①样本均值 样本均值:一组数据加权平均的结果,通常记作 。 ?简单平均数 如果样本数据为点数据x1,x2,…,xn,则均值为简单平均数 ?加权平均值 如果样本数据为区间数据,假设各区间的组中值为xi ,各组频数
文档评论(0)