网站大量收购独家精品文档,联系QQ:2885784924

正态分布、区间估计.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态分布、区间估计.ppt

实验三、参数估计 抽样分布的特点 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律:围绕总体均数,中间多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均数的变异范围逐渐缩小。 由于总体中个体变异的存在,在抽样过程中产生的样本统计量与总体参数间的差异称为抽样误差。 t分布 设从正态分布N(?,?2)中随机抽取含量为n的样本,设: 实际工作中,总体方差未知,用样本方差代替,此时: t分布曲线 单峰分布,曲线以0为中心,左右对称类似于标准正态分布。 t分布的形状与自由度?有关 tα/2,v 参数估计:由已知的样本统计量推断总体参数。 参数估计:点估计和区间估计; 区间估计: 假设某个总体的均数为μ,需要找到两个数值A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含μ。即 P(AμB)=0.95 总体均数μ的区间估计 由于总体情况未知,要计算总体参数μ的置信区间,必须依靠样本统计量进行推断。 样本是从总体中抽样获得,因此不可避免存在抽样误差。 因此计算总体参数的置信区间时,必须利用样本统计量,同时考虑抽样误差和可信的程度(1-α)。 σ未知且样本例数n较小时,按t分布原理: 总体均数的可信区间(SAS实现) (1)t 分布法 SAS函数:TINV t=TINV(p,df) 求t分位数的函数,p是从-∞到当前t分位数位置的面积。 df=n-1(自由度) 例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。 f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162 data a; input sex$ age w h @@; cards; f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 F 16 60 165 m 17 65 175 f 18 61 162 ; proc means; var h; Output out=b mean=mean std=s n=n; data c; set b; t=tinv(0.975,n-1); /*也可使用t=tinv(0.025,n-1);但此时计算出来的t界值为负数。*/ yl=mean-t*s/sqrt(n); /*可信区间的下限*/ y2=mean+t*s/sqrt(n); /*可信区间的上限*/ proc print; run; Output语句注解 语句格式: OUTPUT OUT=数据集名 [统计关键字=变量名] 功能: 将过程结果输出到一个新SAS数据集。 data aa; input x s n; y1=x-1.96*s/sqrt(n); /*可信区间的下限*/ y2=x+1.96*s/sqrt(n); /*可信区间的上限*/ cards; 172.2 4.5 90 ; proc print; run; 样本频率的抽样误差 随机变量 X ~ B(n,?) 样本频率 总体均数参数为π, 标准差为 总体概率的置信区间 估计方法: 查表法:当样本含量n较小,比如n ? 50 正态近似法: 当n足够大,且样本频率p和(1?p)均不太小时,如np与n(1?p) 均大于5 例5-6  某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。 解:查附表6,n = 39,X=2,交叉处的数值为1~17,即该手术合并症发生概率的95%置信区间为1% ~ 17%。 例5-7 某医生用某药物治疗31例脑血管梗塞患者,其中25例患者治疗有

文档评论(0)

caijie1982 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档