- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章节 抽样-抽样分布
第六章 抽样与抽样分布; 1、重复抽样
重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中,再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为重复抽样(sampling with replacement)。
2、不重复抽样
不重复抽样:一个元素被抽中后不再放回总体,然后再从所剩的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为不重复抽样(sampling without replacement)。;二、三种不同性质的分布
(一)总体分布:总体中各元素的观测值所形成的相对频数分布,称为总体分布。
(population distribution)。
(二)样本分布:从总体中抽取容量为n的样本,有这n个观测值形成的相对频数分布,称为样本分布(sample distribution)。
(三)某个样本统计量的抽样分布:从理论上说就是在重复选取容量为n的样本时,由该统计量的所有可能值形成的相对频数分布。; 可分为样本均数的抽样分布;样本率的抽样分布;样本标准差的抽样分布。
1、样本均数的抽样分布
定义:在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,称为样本均数的抽样分布。
(1)x-bar抽样分布的形成过程
例6.1.1:设一个总体有4个元素,即总体元素的个数N=4,4个元素的取值分别为:x1=1,x2=2,x3=3,x4=4。; 从总体中采取重复抽样方法抽取容量为n=2的随机样本,写出样本均值x-bar的抽样分布。
第六章 抽样与抽样分布.ppt
(2)抽样均值抽样分布的形成过程可以概括如下:;(3)X-bar抽样分布形式
x-bar的抽样分布与原总体的分布和样本容量有关。
结论:
ⅰ 如果原有总体是正态分布,则无论样本容量的大小,样本均值的抽样分布都服从正态分布。
ⅱ 如果原有总体分布是非正态分布,则要看样本的大小,随着样本容量的增大(n≥30)不论原有总体是否是正态分布,样本均值的抽样分布都趋于正态分布,该正态分布的均值为μ,标准差为;ⅲ 如果总体不是正态分布,当n为小样本时(n≤30),样本均值的分布不是正太分布,这时就不能按正态分布来推断总体均值。样本均值的抽样分布与总体分布的关系可用下图来描述。; 样本分布与???体分布关系图;(4)样本均值的抽样分布特征
设总体共有N个元素,其均值为μ,方差为
从中抽取容量为n的样本,样本均值的数学期望(样本均值的均值)为 μ,样本均值的方差为总
体方差的1/n。
样本均值的均值 =μ
样本的方差值 =
;2、样本比例的抽样分布
比例问题适用于研究分类变量。就一个具有N个元素的总体而言,具有某种属性的元素个数为N0,具有另一种属性的元素个数为N1,将具有某种属性的元素个数与总体全部元素个数之比称为总体比例,用π表示,则有π=N0/N,而具有另一种属性的元素个数与总体全部单位数之比为
N1/N=1-π。相应地,样本比例用p表示,同样有p=n0/n,n1/n=1-p。;(1)定义:样本比例的抽样分布是指在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布,称为样本比例的抽样分布。
(2)结论
ⅰ结论:当样本容量很大时,样本比例p的抽样分布可用正态分布近似。
ⅱ 结论:对于一个具体的样本比例p,若np≥5和n(1-p)≥5,就可以认为样本容量足够大。
;3、样本方差的抽样分布
(1)定义:在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布,称为样本方差的抽样分布。
;;;(2)样本抽样分布的性质(卡方分布)
当n=20时,卡方分布分布基本成对称分布
;卡方分布性质:
ⅰ 卡方分布的值始终为正。
ⅱ 卡方分布的形状取决于n的大小,通常为 不对称的右偏分布,随着自由度的增大趋向对称。
ⅲ 卡方对应的面积值是指从某一卡方(?2)到正无穷所对应的面积。
;(3)卡方分布函数及反函数
ⅰ卡方分布函数【CHIDIST】
它的格式为CHIDIST(?2,df), ?2是 指卡方值,df是指自由度。
ⅱ 卡方分布的反函数【CHIINV】
它的格式为CHIDIINV(a,df),a是
指从某一卡方值到正无穷大的概率, df是指自由度。
; 样本统计量的抽样分布
;第二节 两个总体参数推断时样本统计量的抽样分布;一、两样本均值之差的抽样分布
(一)两样本均值之差
文档评论(0)