第五章参数估计基础7版1.pptVIP

下载本文档

4
0
约2.51千字
约 41页
2018-05-04 发布于四川
举报
版权申诉

第五章参数估计基础7版1.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第五章参数估计基础7版1.ppt

第五章参数估计基础;学习要点;第一节抽样分布与抽样误差;第一节抽样分布与抽样误差;第一节抽样分布与抽样误差;抽样实验：假定从13岁女学生身高总体均数，总体标准差的正态总体中进行随机抽样。;抽样实验：假定从13岁女学生身高总体均数，总体标准差的正态总体中进行随机抽样。;样本均数的分布特点： 1.各样本均数未必等于总体均数； 2.样本均数之间存在差异； 3.样本均数的分布很有规律，围绕着总体均数，中间多，两边少，左右基本对称，也服从正态分布。 4.样本均数的变异较之原变量的变异大大缩小。;;第一节抽样分布与抽样误差;; 1）从正态总体N(μ,σ2)中，随机抽取例数为n的多个样本，样本均数服从正态分布；即使是从偏态总体中随机抽样，当n足够大时(如n＞50)，也近似正态分布。; 身高组段频数组中值 fx fx2;; 例5-1 2000年某研究所随机调查某地健康成年男子27人，得到血红蛋白的均数为125g/L，标准差为15g/L 。试估计该样本均数的抽样误差。;二、样本频率的抽样分布与抽样误差 ;π ：总体率，n：样本例数。当π未知时，p π（当样本含量足够大，且p和1-p不太小）公式为: ：率的标准误的估计值，p：样本率。; 例5-2 某市随机调查了50岁以上的中老年妇女776人，其中患有骨质疏松症者322人，患病率为41.5%，试计算该样本频率的抽样误差。; 一、t分布的概念在统计应用中，可以把任何一个均数为μ，标准差为σ的正态分布N(μ,σ2)转变为μ=0,σ=1的标准正态分布，即将正态变量值X用来代替。;第二节 t 分布;t分布曲线特点： 1） t分布曲线是单峰分布，它以0为中心，左右对称。 2）t分布的形状与样本例数n有关。自由度越小，则越大，t 值越分散，曲线的峰部越矮，尾部翘的越高。 3) 当 n→∞时，则S逼近σ，t分布逼近标准正态分布。 t分布不是一条曲线，而是一簇曲线。;;与单侧概率相对应的t值用表示，与双侧概率相对应的t值用表示。; 一???参数估计的概念统计推断包括参数估计和假设检验。参数估计就是用样本指标（统计量）来估计总体指标（参数）。; ，即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。;2. 区间估计：按预先给定的概率(1－α)估计总体参数的可能范围，该范围就称为总体参数的1－α置信区间(confidence interval CI)。预先给定的概率(1－α)称为置信度，常取95%或99%。如无特别说明，一般取双侧95%。;通式：（双侧）;通式：（双侧）;例5-4 某市2000年随机测量了90名19岁健康男大学生的身高，其均数为172.2cm，标准差为4.5cm,，试估计该地19岁健康男大学生的身高的95%置信区间。;（3）σ未知且样本例数n较小时，按t分布原理，此时某自由度的t曲线下有95%的t值约在±t0.05(ν)之间，;例5-3 已知某地27例健康成年男性血红蛋白量的均数为，标准差S=15g/L ,试问该地健康成年男性血红蛋白量的95%和99%置信区间。本例n=27，S=15; 置信区间的两个要素准确度：反映置信度1-α的大小，即区间包含总体均数的概率大小。精度：反映区间的长度。在置信度确定的情况下，增加样本例数，会减小 tа,ν 和，可减少区间长度，提高精度。;意义： 95%的参考值范围是指同质总体内包括95%个体值的估计范围。若总体为正态分布，常按计算。 95%的可信区间是指按95%的置信度估计的总体参数的所在范围。若为大样本，按计算。计算上：置信区间用标准误，参考值范围用标准差。; 标准差与标准误的区别