- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
湖北大学商学院 chen qianli 第 4 章 参数估计 7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.3 两个总体参数的区间估计 7.4 样本容量的确定 不像其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。 Gudmund R.Iversen 大学生每周上网花多少时间? 为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等 问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示 大学生每周上网花多少时间? 平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出估计的理论依据是什么? 参数估计在统计方法中的地位 统计推断的过程 估计量与估计值 (estimator estimated value) 估计量:用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值? 的一个估计量 参数用? 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 ?x =80,则80就是?的估计值 参数估计的方法 点估计 (point estimate) 用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 无法给出估计值接近总体参数程度的信息 虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计实例:HMO 区间估计实例:HMO 样本均值 是未知总体均值 的自然的估计量,因为它的无偏性。 作为总体均值的估计有多可靠?显然再进行一次抽样,肯定不会给出405.02的值。 要了解此种估计方法的可靠性,需要知道样本均值的分布,即抽样分布。由中心极限定理(CLT)知,样本均值近似服从正态分布 区间估计实例:HMO 假设总体标准差 等于样本标准差s=112.08,在大样本(n=453)下此近似是合理的。根据样本均值的抽样分布可得: 变换后可得: 统计推断的语言是用长期会发生的事实来表达对任何一个样本结果的可信程度。 Stata命令:ttest HMO == 400 区间估计实例:HMO 我们通过一个过程达到这些数值,此过程能在95%的时间里给出准确结果。 置信区间:一个参数的1-α水平的置信区间有两部分: 从数据计算的区间,一般形式为: 估计值 边际误差 置信水平1-α,给出在重复样本中此区间包含真实参数的概率。 总体均值的置信区间 从未知均值 和已知标准差 的总体中获取容量为n的SRS, 的置信水平为1-α的置信区间为: 其中 为标准正态分布曲线右侧的概率为 的临界值。 称为边际误差。 此区间在正态总体时是准确的,在其他总体分布但n很大时是近似正确的。 置信区间如何变化 估计总体均值的边际误差 可说明置信区间的重要性质: 高置信水平1-α会增加 ,从而增加边际误差。我们当然希望高置信水平和小边际误差,但改进一个会恶化另一个。有三种方式减小边际误差:1.使用较低的置信水平;2.减少σ 3.增加样本容量n 区间估计注意事项: 数据必须是总体的一个SRS。 对于比SRS复杂的概率抽样设计方案以上公式是不正确的。可以获得其他概率抽样的相关公式。 对于带有未知大小偏误的随意收集的数据,没有正确的推断方法。好的公式不能挽救坏的数据。 因为样本均值是不耐抗的,异常值会对置信区间产生很大影响。应该搜索异常值并试图修正或说明去除的理由,然
文档评论(0)