- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样误差和假设检验
第四章 抽样误差与假设检验 董 英 第一节 均数的抽样误差与标准误 一、抽 样 研 究 按照随机化原则 采用正确的抽样方法 从总体中抽取有代表性的一部分 组成样本 用样本信息推断总体特征的研究 二、抽 样 误 差 从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30 若从正态总体 抽样得到1000个样本,将1000个样本均数看成新变量,构成新的分布: 二、抽 样 误 差 二、抽 样 误 差 样本均数的分布特点: 各样本均数不一定等于总体均数 样本均数间存在差异 样本均数的分布为中间多,两边少,围绕总体均数上下波动,左右基本对称。 样本均数的变异较之原变量的变异大大减小。 二、抽 样 误 差 抽样误差(Sampling error) 由抽样引起的样本统计量与总体参数间(或各统计量之间)的差异 抽样误差不可避免 抽样误差有一定的规律性 中心极限定理: 若个体资料 服从正态总体 ,则样本均数 也服从正态分布: 个体资料 服从偏态分布,当样本量n较大时,样本均数 近似服从正态分布: 三、标准误 样本均数的标准差 ,称为样本均数的标准误(standard error of mean),简称标准误(SE) 。 标准误意义:反映样本均数抽样误差的大小,SE越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。 标准误的大小: n一定时,标准误与标准差呈正比; 标准差一定,标准误与n的平方根成反比 增加样本含量可减少抽样误差 标准误主要用途: 衡量抽样误差大小,SE越小,样本均数可信度越高 结合标准正态分布和t分布曲线下的面积规律,估计总体均数的置信区间 应用于假设检验 由于实际 往往未知,需要用样本 来估计 ,样本均数标准误的估计式: 注意区别: 可信区间估计的优劣: 准确度:即可信度1??,愈接近1愈好,如99%的可信度比95%的可信度要好; 精密度:即区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。 在可信度确定的情况下,增加样本含量可减小区间宽度。 二、总体均数可信区间的计算 计算方法: σ已知,按u分布。 σ未知,但n足够大,按u分布。 σ未知,且n较小,按t分布。 1.σ已知时,总体均数双侧可信区间为: 2.σ未知但n较大时,按u分布计算总体均数的可信区间 3.σ未知且n较小时,按t分布计算总体均数的可信区间 思考总体均数可信区间与参考值范围的区别和联系? 第三节 t 分布 ,标准正态分布与U统计量 实际研究中?未知,用样本的标准差S作为?的一个近似值(估计值)代替?,得到变换后的统计量并记为 英国统计学家W. S. Gosset(1908)设 ,称统计量t的分布规律为t分布,自由度为v: 每个自由度v对应一个分布,因此t分布是一簇分布 三条t分布密度曲线 t分布的图形特征 分布特征 t分布曲线是单峰的 关于t = 0对称 t分布与正态分布的关系 自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积 当自由度 时,t分布逼近于标准正态分布。 t分布的界值 给定自由度v,t分布曲线的双侧尾部面积为?时对应的t值,记为 并称 其为t的双侧界值 单侧界值 :一侧尾部面积为?时对应的t值 对称性得:单侧曲线下面积=2双侧曲线下面积 给定曲线下面积对应的界值与自由度有关 同样的尾部面积,t分布的界值要大于标准正态分布的界值 t分布的界值 习题 一、名词解释 1.抽样误差 2.均数标准误 3.置信区间 习题 二、最佳选择题 1、( )小,表示用该样本均数估计总体均数的可靠性大。 A、CV B、S C、 D、R E、四分位间距 2、在同一总体随机抽样,其他条件不变,样本含量越大,则______。 A.样本标准差s越大 B.样本标准差s越小 C.总体均数的95%可信区间越窄 D.总体均数的95%可信区间越宽 E. 样本标准差s越小,总体均数的95%可信区间越窄 3、在同一总体随机抽样,样本含量n固定时,α越小,总体均数可信区间_______。 A.越宽 B.越窄
您可能关注的文档
最近下载
- 一种钢铁综合废水浓盐水的减量化、资源化处理组合方法与系统.pdf VIP
- 《碳中和管理体系 要求》(征求意见稿).pdf
- 医院银行存款管理制度.docx VIP
- 新北师大版数学五年级上册第六单元“组合图形面积”单元试卷 .pdf VIP
- 人教版高中英语必修一全册教学课件.pptx
- 《工逆向工程与增材制造》课件——17. Geomagic Design X 草图建模方法 .pptx VIP
- 海姆立克急救法-(精).ppt VIP
- 北师大版九年级下册数学全册同步练习.docx VIP
- 2025全国青少年模拟飞行考核理论知识题库40题及参考答案1套.docx VIP
- 在线网课学习课堂《兵棋(中国人民武装警察部队警官学院)》单元测试考核答案.docx VIP
文档评论(0)