- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)综述
样本均值
样本方差
样本标准差
样本偏度
§5.3 统计量及其分布
样本峰度
次序统计量
样本分位数
样本中位数
5.3.1 统计量与抽样分布
当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。
定义5.3.1 设 x1, x2, …, xn 为取自某总体的样
本,若样本函数T = T(x1, x2, …, xn)中不含有
任何未知参数。则称T为统计量。
统计量的分布称为抽样分布。
按照这一定义:若 x1, x2, …, xn 为样本,
则 以及经验分布函数Fn(x)都是统计量。
而当?, ?2 未知时,x1??, x1/? 等均不是统计量。
统计量是样本的一个函数
统计量是统计推断的基础
尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。
5.3.2 样本均值及其抽样分布
定义5.3.2 设 x1, x2, …, xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即
思考:在分组样本场合,样本均值如何计算?
二者结果相同吗?
x
x= (x1+…+xn)/n
定理5.3.2 数据观测值与均值的偏差平方和
最小,即在形如 ? (xi?c)2 的函数中,
样本均值的基本性质:
定理5.3.1 若把样本中的数据与样本均值之差
称为偏差,则样本所有偏差之和为0,即
最小,其中c为任意给定常数。
样本均值的抽样分布:
定理5.3.3 设x1, x2, …, xn 是来自某个总体的样本,
为样本均值。
(1) 若总体分布为N(?, ?2),则
的精确分布为N(?, ?2/n) ;
若总体分布未知或不是正态分布,
但 E(x)=?, Var(x)=?2,则n 较大时 的渐近分
布为N(?, ?2/n) 。
这里渐近分布是指n 较大时的近似分布.
中心极限定理 (central limit theorem)
?x 的分布趋于正态分布的过程
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
一种理论概率分布
推断总体均值?的理论基础
样本均值的抽样分布
5.3.3 样本方差与样本标准差
称为样本标准差。
定义5.3.3
称为样本方差,
其算术平方根
在n 不大时,常用 作为样本方差,
其算术平方根也称为样本标准差。
xi与样本均值的平均偏差平方和
在这个定义中,
? ( xi ?x )2
n?1称为偏差平方和的自由度。其含义是:
在 确定后, n 个偏差
x1?x, x2?x, …, xn?x
能自由取值,因为
只有n?1个数据可以自由变动,而第n个则不
?(xi ?x ) = 0 .
称为偏差平方和,
中
样本偏差平方和有三个不同的表达式:
?( xi?x )2 = ?xi2 – (?xi)2/n = ?xi2 – nx
它们都可用来计算样本方差。
思考:分组样本如何计算样本方差?
样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。
定理5.3.4 设总体 X 具有二阶矩,即
E(x)=? ? ?, Var(x)=?2 ? ?,
x1, x2, …, xn 为从该总体得到的样本,
x
和s2 分别是样本均值和样本方差,则
E( x )=?, Var( x )=?2 /n,
E(s2) =?2
习题5.3
Q8
Q3
Q7
5.3 统计量及其分布(续)
样本矩
次序统计量
样本分位数
箱线图
5.3.4 样本矩及其函数
样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。
定义5.3.4 ak = (?xik)/n 称为样本 k 阶原点矩,
特别,样本一阶原点矩就是样本均值。
称为样本k阶中心矩。
特别,样本二阶中心矩就是样本方差。
bk = ? (xi ? x)k/n
当总体关于分布中心对称时,我们用
和 s
刻画样本特征很有代表性,而当其不对称时,
只用
就显得很不够。为此,需要一些刻画分布形状的统计量,如样本偏度和样本峰度,它们都是样本中心矩的函数。
样本偏度?1反映了总体分布密度曲线的对称性信息。样本峰度?2反映了总体分布密度曲线在其峰值附近的陡峭程度。
定义: ?1 = b3/b23/2 称为样本偏度,
?2 = b4/b22
文档评论(0)