- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6.概率分布及总体平均数的推断
理解抽样分布的意义
了解抽样分布的形成过程
平均数抽样分布的定理
样本平均数与总体平均数离差统计量的形态
总体平均数的估计
假设检验的基本原理
总体平均数的显著性检验
;一、分布的类型;频率分布与概率分布的区别;样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。
结果来自容量相同的所有可能样本
提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据;抽样分布的形成过程;1. 概念
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
一种理论概率分布
推断总体均值?的理论基础 ;例题分析;? 现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为;? 计算出各样本的均值,如下表。并给出样本均值的抽样分布; ? = 2.5
σ2 =1.25;2. 中心极限定理;当样本容量足够大时(n ? 30) ,样本均值的抽样分布逐渐趋于正态分布;3. 抽样分布与总体分布的关系;样本均值的数学期望
样本均值的方差
重复抽样
不重复抽样;比较及结论:1. 样本均值的均值(数学期望) 等于总体均值
2. 样本均值的方差等于总体方差的1/n;例题;5. 标准误 (standard error) ;6. 总体标准差σ的无偏估计量;7. 平均数标准误的估计值;练习;练习;练习;8. 样本平均数与总体平均数离差统计量的形态;8. 样本平均数与总体平均数离差统计量的形态;1 定义:由小样本统计量形成的概率分布。
2 t分布的特点
t分布是对称分布。平均数位于曲线中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。
分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量即随自由度的大小而有规律地变动。;t分布;标准正态分布与t分布图;t分布表中的概率;四、参数估计;参数估计在统计方法中的地位;定义
当总体参数不清楚时,用一个特定值(一般常用样本统计量)进行估计,这类问题就是点估计。统计量为数轴上某一点值,所以称为点估计。
例如:用样本均值直接作为总体均值的估计
例如:用两个样本均值之差直接作为总体均值之差的估计; (1)无偏性。指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。如果用某个统计量估计总体的误差平均数大于0或小于0,这个统计量就是有偏统计量。总体参数的良好估计值,应具备无偏性。
(2)一致性。所谓一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。
(3)有效性。是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。; 缺点:没有给出估计值接近总体参数程度的信息。;(二)区间估计;根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。
比如,某班级平均分数在75~85之间,置信水平是.95;由样本统计量所构造的总体参数的估计区间称为置信区间;
统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间;
用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值;
我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。;; 统计分析中一般规定:正确估计的概率,也即置信水平 为.95或.99,那么显著性水平 则为.05或.01,这是依据.05或.01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。
置信度:又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。(0.05—Z*、0.01 —Z** 、0.001 —Z*** )
置信区间:或称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。;区间估计的具体步骤;假定条件
总体服从正态分布
如果不是正态分布,可由正态分布来近似 (n30)
使用正态分布统计量 z;练习:
有一个49名学生的班级,某学科历年考试成绩的σ=5,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。 ;2. 总体方差未知条件下总体平均数的区间估计;总体均值的区间估计(例题分析);解:已知X~N(?,?2),n=16, 1-? = 95%,t?/2=2.131
根据样本数据计算得: ,
总体均值?在1-?置
文档评论(0)