- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章参数估计 估计就是根据你拥有的信息来对现实世界进行某种判断。 你可以根据一个人的衣着、言谈和举止判断其身份 你可以根据一个人的脸色,猜出其心情和身体状况 统计中的估计也不例外,它是完全根据数据做出的。 如果我们想知道南充人认可某饮料的比例,人们只有在南充人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比例。 从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。 从数据得到关于现实世界的结论的过程就叫做统计推断(statistical inference)。 上面调查例子是估计总体参数(某种意见的比例)的一个过程。 估计(estimation)是统计推断的重要内容之一。 统计推断的另一个主要内容是下一章要引进的假设检验(hypothesis testing)。 §4.1 用估计量估计总体参数 人们往往先假定某数据来自一个特定的总体族(比如正态分布族)。 而要确定是总体族的哪个成员则需要知道总体参数值(比如总体均值和总体方差)。 人们于是可以用相应的样本统计量(比如样本均值和样本方差)来估计相应的总体参数 §4.1 用估计量估计总体参数 一些常见的涉及总体的参数包括总体均值(m)、总体标准差(s)或方差(s2)和(Bernoulli试验中)成功概率?等(总体中含有某种特征的个体之比例)。 正态分布族中的成员被(总体)均值和标准差完全确定; Bernoulli分布族的成员被概率(或比例)p完全决定。 因此如果能够对这些参数进行估计,总体分布也就估计出来了。 §4.1 用估计量估计总体参数 估计的根据为总体抽取的样本。 样本的(不包含未知总体参数的)函数称为统计量;而用于估计的统计量称为估计量(estimator)。 由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。 如果样本已经得到,把数据代入之后,估计量就有了一个数值,称为该估计量的一个实现(realization)或取值,也称为一个估计值(estimate)。 §4.1 用估计量估计总体参数 这里介绍两种估计,一种是点估计(point estimate),即用估计量的实现值来近似相应的总体参数。 另一种是区间估计(interval estimate);它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。 点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。 §4.2 点估计 用什么样的估计量来估计参数呢? 实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。 当然,统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。 这样就出现了按照这些标准定义的各种名目的估计量(如无偏估计量等)。 另一些估计量则是由它们的计算方式来命名的(如最大似然估计和矩估计等)。 §4.2 点估计 最常用的估计量就是我们熟悉的样本均值、样本标准差(s)和(Bernoulli试验的)成功比例(x/n); 人们用它们来分别估计总体均值(m)、总体标准差(s)和成功概率(或总体中的比例) ? 。这些在前面都已经介绍过,大家也知道如何通过计算机(或公式)来计算它们。 §4.2 点估计 那么,什么是好估计量的标准呢? 评价一个统计量好坏的标准很多;本教材涉及到三个标准。 无偏性(unbiasedness) 无偏性:估计量抽样分布的数学期望等于被估计的总体参数 有效性(efficiency) 一致性(consistency) 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数 §4.3 区间估计 当描述一个人的体重时,你一般可能不会说这个人是76.35公斤 你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范围就是区间估计的例子。 区间估计 (interval estimate) 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示 置信水平(confidence level) 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 -?)?? ?为总体参数未在区间内的比例? 常用的置信水平值有 99%, 95%, 90% 相应的?为0.01,0.05,0.10 置信区间 (confidence interval) 由样本统计量所构造的总体参数的估计区间称为
您可能关注的文档
最近下载
- 陈永鑫《茉莉花二重奏》吉他谱.pdf VIP
- 购买社会组织服务-社会救助照料支持服务方案投标文件(技术标).doc
- PowerFlex 700变频器用户手册(中文).pdf
- 年产15万平米水泥预制板生产建设项目环评环境影响报告表(新版环评).pdf VIP
- BOSS效果器GT8音色.doc VIP
- BOSS GT-8中文说明书.pdf
- 医学科研方向研究进展汇报.pptx
- 地球表部圈层相互作用.ppt
- 通用汽车网络安全随机数生成规范CYS9000 - Random Number Generator Security.pdf VIP
- 地球科学概论 第10讲 _生物圈——[武汉大学 地球科学概论].pdf VIP
文档评论(0)