2.数理统计的基本答题.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 数理统计的基本概念 总体、样本与统计模型 统计量与抽样分布 次序统计量 描述性统计分布——总体特征的识别 作业: 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 四分位间距 首先,定义样本的分位点: 对于介于(0,1) 的p ,样本的上1-p分位点定义为x([np+0.5]) 那么,样本的四分位间距为: 它表示去掉两端各四分之一的数据后,样本中部一半的数据的极差,其大小反映了总体的四分位间距即总体的上0.25分位点与上0.75分位点之间的距离,从而反映了样本取值的分散情况。 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 注:作为总体变异性的度量,四分位点间距和样本方差的角度是不同的。 前者是从样本比例(概率)的角度,而后者是从变量数值大小的角度来看变异性的; 前者不易受离群值的影响,但由于两端各去掉了四分之一的数据,有时低估总体的变异性。而样本方差和标准差容易受到离群值的影响。正态总体N(μ, σ2)的四分位间距为1.35 σ. 一个分布的偏度系数定义为: 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 (3) 样本偏度系数和峰度系数 峰度系数定义为: 偏度系数主要用来反映分布的偏倚性。 偏度系数和峰度系数常用来衡量分布和正态分布的差异。 正态分布的偏度系数和峰度系数都是0. 对于所有3阶矩存在的对称分布,偏度系数为0。 显然,对于随机变量做线性变换后不改变偏度和峰度系数。 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 2. 总体特征的样本表现 (1)总体分布的常见分布 (2)直方图 (3)茎叶图 (4)箱线图 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 2. 总体特征的样本表现 (1)总体分布的常见分布 总体的基本特征之一是其形态。 一个连续型分布称为对称的,如果存在一个常数μ,使得该分布的概率密度f(x)满足f(x-μ)=f(x+μ)对于所有x成立. 此时μ为该分布的中位数;进一步地,若数学期望存在,则μ也是其数学期望。 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 一个分布称为左偏的,如果其偏度系数小于0; 否则,如果其偏度系数大于0,就称该分布为右偏的。 如果分布的概率密度函数(或概率密度)只有一个极大值点,称其为单峰的;如果有多个极大值点,就称为多峰的。 许多多峰分布都是由多个分布混合而成的。 当分布左偏并且单峰时,数学期望一般会小于中位数; 当分布右偏并且单峰时,数学期望一般会大于中位数。 作为总体数学期望和总体中位数的估计,样本均值和样本中位数也有同样的性质。因此,可用其探索总体的有关形态。 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 (2)直方图 直方图是利用观测样本对一元总体(即单个变量)的常用方法。 当样本量较大时,我们可以 把变量的取值范围划分为若干区间; 计算观测值落入每个区间的概率; 列成表格并画出直方图; 用来推测总体分布的形状。 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 例. 对于前例中婴儿体重样本,画出直方图。 解:直方图的画法如下: 步骤1:首先把变量的取值范围分为若干区间。 取值范围可以取为[a,b],其中a比样本最小值稍小,b比样本的最大值稍大。 记观测值为x1,x2,…,xn,最大值和最小值分别记 为x(n)和x(1)。 本例中,最小值为0.91,最大值为4.56 因此,可以把范围取定为[a,b]=[0.50,5.00] 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 注:区间的个数m一般可取为5至20,视样本量n的大小决定: 当n50时可取m为5或6;当50≤n≤100时可取m为6至10; 当100≤n≤250时可取m为7到12;当n250时可取m为10到20. 一般地,各个区间取为等长的;并使得数据的最小值与最大值分别落入第一个区间和最后一个区间。 本例中,划分m=9个区间,区间长度为0.50,区间的分点为:0.50, 1.00, 1.50, 2.00, 2.50, 3.00, 3.50, 4.00, 4.50, 5.00 第2章 数理统计的基本概念 五、描述性统计分析——总体特征的识别 步骤2:其次,计数观测值x1,x2,…,xn中落入每个区间(ai , ai+1] 中的频数 计算相应的频率fi/n,i=0,1,…,m-1 步骤3:以变量为横轴,在横轴上标出各个区

文档评论(0)

a1166671 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档