(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)综述.pptx

(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)综述.pptx

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)综述

样本均值 样本方差 样本标准差 样本偏度 §5.3 统计量及其分布 样本峰度 次序统计量 样本分位数 样本中位数 5.3.1 统计量与抽样分布 当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。 定义5.3.1 设 x1, x2, …, xn 为取自某总体的样 本,若样本函数T = T(x1, x2, …, xn)中不含有 任何未知参数。则称T为统计量。 统计量的分布称为抽样分布。 按照这一定义:若 x1, x2, …, xn 为样本, 则 以及经验分布函数Fn(x)都是统计量。 而当?, ?2 未知时,x1??, x1/? 等均不是统计量。 统计量是样本的一个函数 统计量是统计推断的基础 尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。 5.3.2 样本均值及其抽样分布 定义5.3.2 设 x1, x2, …, xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即 思考:在分组样本场合,样本均值如何计算? 二者结果相同吗? x x= (x1+…+xn)/n 定理5.3.2 数据观测值与均值的偏差平方和 最小,即在形如 ? (xi?c)2 的函数中, 样本均值的基本性质: 定理5.3.1 若把样本中的数据与样本均值之差 称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。 样本均值的抽样分布: 定理5.3.3 设x1, x2, …, xn 是来自某个总体的样本, 为样本均值。 (1) 若总体分布为N(?, ?2),则 的精确分布为N(?, ?2/n) ; 若总体分布未知或不是正态分布, 但 E(x)=?, Var(x)=?2,则n 较大时 的渐近分 布为N(?, ?2/n) 。 这里渐近分布是指n 较大时的近似分布. 中心极限定理 (central limit theorem) ?x 的分布趋于正态分布的过程 在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布 一种理论概率分布 推断总体均值?的理论基础 样本均值的抽样分布 5.3.3 样本方差与样本标准差 称为样本标准差。 定义5.3.3 称为样本方差, 其算术平方根 在n 不大时,常用 作为样本方差, 其算术平方根也称为样本标准差。 xi与样本均值的平均偏差平方和 在这个定义中, ? ( xi ?x )2 n?1称为偏差平方和的自由度。其含义是: 在 确定后, n 个偏差 x1?x, x2?x, …, xn?x 能自由取值,因为 只有n?1个数据可以自由变动,而第n个则不 ?(xi ?x ) = 0 . 称为偏差平方和, 中 样本偏差平方和有三个不同的表达式: ?( xi?x )2 = ?xi2 – (?xi)2/n = ?xi2 – nx 它们都可用来计算样本方差。 思考:分组样本如何计算样本方差? 样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。 定理5.3.4 设总体 X 具有二阶矩,即 E(x)=? ? ?, Var(x)=?2 ? ?, x1, x2, …, xn 为从该总体得到的样本, x 和s2 分别是样本均值和样本方差,则 E( x )=?, Var( x )=?2 /n, E(s2) =?2 习题5.3 Q8 Q3 Q7 5.3 统计量及其分布(续) 样本矩 次序统计量 样本分位数 箱线图 5.3.4 样本矩及其函数 样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。 定义5.3.4 ak = (?xik)/n 称为样本 k 阶原点矩, 特别,样本一阶原点矩就是样本均值。 称为样本k阶中心矩。 特别,样本二阶中心矩就是样本方差。 bk = ? (xi ? x)k/n 当总体关于分布中心对称时,我们用 和 s 刻画样本特征很有代表性,而当其不对称时, 只用 就显得很不够。为此,需要一些刻画分布形状的统计量,如样本偏度和样本峰度,它们都是样本中心矩的函数。 样本偏度?1反映了总体分布密度曲线的对称性信息。样本峰度?2反映了总体分布密度曲线在其峰值附近的陡峭程度。 定义: ?1 = b3/b23/2 称为样本偏度, ?2 = b4/b22

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档