- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计推断 —参数估计 南京医科大学 荀鹏程 统计推断的思路 统计推断的内容 统计推断(statistical inference),是指如何用样本性质推断总体特征。 参数估计(parameter estimation) 假设检验(hypothesis test) 参数估计 由样本统计量估计总体参数 点估计(point estimation) 区间估计(interval estimation) 点估计 直接用样本统计量作为总体参数的估计值 方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的。 区间估计 按一定的概率或可信度(1-? )用一个区间估计总体参数所在范围,这个范围称作可信度为1-?的可信区间(confidence interval, CI),又称置信区间 。这种估计方法称为区间估计。 区间估计 预先给定的概率(1-α)称为可信度或者置信度(confidence level),常取95%或99%。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限 可信区间的两个要素 可信度(1-?), 可靠性 一般取90%,95%。 可人为控制。 精确性 是指区间的大小(或长短) 兼顾可靠性、精确性 可信区间的确切涵义 可信度为95% 的可信区间的确切涵义是:每100个样本所算得的100个可信区间,平均有95个包含了总体参数 。 均数的可信区间 总体均数的(1-? )可信区间定义为: 影响可信区间大小的因素 可信度 可信度越大,区间越宽 个体变异 变异越大,区间越宽 样本含量 样本含量越大,区间越窄 当样本含量较大时,例如n>100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间的近似计算。相应的100(1-?)%可信区间为: 例4.1 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。 例4.1 本例自由度?=12-1=24,经查表得t0.05,24=2.064,则 即该地正常成年男子脉搏总体均数的95%可信区间为:70.9~76.3(次/分) 。用该区间估计该地正常成年男子脉搏总体均数的可信度为95%。 例4.2 某市2001年120名7岁男孩身高均数为123.62cm,标准差为4.75cm,计算该市7岁男童总体均数90%的可信区间。 例4.2 n=120100,标准正态分布代替t分布,u0.10=1.645 即该市7岁男童平均身高的90%可信区间为:122.91~124.33(cm),可认为该市7岁男童平均身高在122.91~124.33(cm)之间 。 正确理解可信区间的涵义 可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的可信度是针对可信区间的构建方法而言的。 以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。 正确理解可信区间的涵义 在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值 。 可信区间与参考值范围的区别 可信区间用于估计总体参数,参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。 下列说法正确吗? 算得某95%的可信区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。 该区间包含总体参数,可信度为95%。 标准差与标准误的联系 都是变异指标。 当n不变时,标准差↑,标准误↑ 标准差与标准误的区别 标准差描述原始数据的离散程度; 标准误反映均数的抽样误差大小。 标准差与标准误的区别 标准差衡量样本均数对原始数据的代表性 ,标准差越小,样本均数对原始数据的代表性越好; 标准误衡量样本均数估计总体均数的精确性,标准误越小,样本均数估计总体均数精度越高。 标准差与标准误的区别 当 n→N 时,样本标准差→总体标准差 当 n→N 时,标准误→0 标准差与标准误的区别 结合样本均数和正态分布的规律,标准差估计参考值范围 ; 结合样本
您可能关注的文档
最近下载
- 《复活(节选)》课件38张高中语文选择性必修上册.pptx VIP
- 复合手术室的管理课件.pptx VIP
- 《中华人民共和国节约能源法》解读与培训课件.pptx VIP
- 今年清华大学学术大咖分享国家社科申报秘籍.doc VIP
- 2025新营销5.0营销平台时代.pdf VIP
- 排球:正面双手垫球 教案.docx VIP
- 2025年17周新模式英语1Unit1-4全套教案.pdf VIP
- RocscienceSlide岩土边坡稳定性分析操作教程(非.pdf VIP
- AWS B4.0M-00焊缝机械试验方法.pdf VIP
- GB_T50795-2012:光伏发电工程施工组织设计规范.pdf VIP
文档评论(0)