- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总体与个体总体的三层含义
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * (4) 统计样本数据落入每个区间的个数——频数, 并列出其频数频率分布表。 表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 累计频率(%) 1 (147,157] 152 4 0.20 20 2 (157,167] 162 8 0.40 60 3 (167,177] 172 5 0.25 85 4 (177,187] 182 2 0.10 95 5 (187,197] 192 1 0.05 100 合计 20 1 5.2.3 样本数据的图形显示 一、直方图 直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。 5.3.1 统计量与抽样分布 §5.3 统计量及其分布 当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。 定义5.3.1 设 x1, x2, …, xn 为取自某总体的样 本,若样本函数T = T(x1, x2, …, xn)中不含有任 何未知参数。则称T为统计量。统计量的分布 称为抽样分布。 5.3.2 样本均值及其抽样分布 定义5.3.2 设 x1, x2, …, xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即 思考:在分组样本场合,样本均值如何计算? 二者结果相同吗? x x= (x1+…+xn)/n 定理5.3.2 数据观测值与均值的偏差平方和 最小,即在形如 ? (xi?c)2 的函数中, 样本均值的基本性质: 定理5.3.1 若把样本中的数据与样本均值之差 称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。 样本均值的抽样分布: 定理5.3.3 设x1, x2, …, xn 是来自某个总体的样本, x 为样本均值。 (1) 若总体分布为N(?, ?2),则 x x 的精确分布为N(?, ?2/n) ; 若总体分布未知或不是正态分布, 但 E(x)=?, Var(x)=?2,则n 较大时 的渐近分 布为N(?, ?2/n) ,常记为 。 x?AN(?, ?2/n) 这里渐近分布是指n 较大时的近似分布. 5.3.3 样本方差与样本标准差 称为样本标准差。 s*= ?s*2 定义5.3.3 称为样本方差, 其算术平方根 在n 不大时,常用 作为样本方差, 其算术平方根也称为样本标准差。 在这个定义中, ? ( xi ?x )2 n?1称为偏差平方和的自由度。其含义是: x 在 确定后, n 个偏差 x1?x, x2?x, …, xn?x 能自由取值,因为 只有n?1个数据可以自由变动,而第n个则不 ?(xi ?x ) = 0 . 称为偏差平方和, 中 样本偏差平方和有三个不同的表达式: ?( xi?x )2 = ?xi2 – (?xi)2/n = ?xi2 – nx 它们都可用来计算样本方差。 思考:分组样本如何计算样本方差? 样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。 定理5.3.4 设总体 X 具有二阶矩,即 E(x)=? ? ?, Var(x)=?2 ? ?, x1, x2, …, xn 为从该总体得到的样本, x 和s2 分别是样本均值和样本方差,则 E( x )=?, Var( x )=?2 /n, E(s2) =?2 5.3.4 样本矩及其函数 样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。 定义5.3.4 ak = (?xik)/n 称为样本 k 阶原点矩, 特别,样本一阶原点矩就是样本均值。 称为样本k阶
文档评论(0)