社会统计分析与数据处理技术(Stata)8 参数估计.ppt

社会统计分析与数据处理技术(Stata)8 参数估计.ppt

  1. 1、本文档共114页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四部分 推断行统计分析 参数估计(parameter estimation)、 假定检验(hypothesis test)与 方差分析(Analysis of variance) 推断性统计 学术研究的目的在于把握总体特征。若掌握总体数据,则只需进行简单的统计描述,就可得到总体特征 事实上,很难获得总体数据;多需要根据样本推断总体特征。若样本代表全体人群,则总结性的推断也具有很高的可信性 推断性统计方法应用概率理论,根据观察到的样本特征预测和推断全域特征 统计上的重要性检验帮助判断假定关系实际发生的概率 只有推断性方法,才能检验假定是否成立 参数估计、假定检验、方差分析都属于推断性分析方法 本章主要内容 8.1.参数估计(parameter estimation) 8.2.假定检验(hypothesis test) 8.3.方差分析(analysis of variance) 8.1:参数估计(parameter estimation) 8.1.1. 基本原理 8.1.2. 基本概念与估计方法 8.1.3. 参数估计举例 参数估计 估计就是根据拥有的信息来对现实世界进行某种判断。人们时刻都在进行估计 估计 (estimation) 是统计性推断的重要内容之一 参数估计是在抽样及抽样分布的基础上,根据样本统计量来推断总体的特征,即用统计量(statistics)去估计总体的参数(parameters) 从数据得到对现实世界的结论的过程就叫做统计推断 (statistical inference) 参数估计的定义 用样本统计量估计总体的参数。比如: 用样本均值估计总体均值 用样本方差估计总体方差 同样本比例估计总体比例 设θ = 总体参数,参数估计也就是如何用样本统计量来估计总体参数θ 样本统计量与总体参数 估计量(estimator)与 估计值(estimated value) 估计量:用于估计总体参数θ的样本统计量,用符号 表示 比如:样本均值、样本比例、样本方差 估计值:估计总体参数时计算出来的估计量的具体数值。比如:若要估计一个公司职员的平均月收入 全公司的平均收入是未知的,称为参数,用θ表示 从中抽取样本,并根据样本计算的平均收入就是一个估计量,用 表示 假如计算出来的是1万元,这个1万元就是估计量的具体数值,即估计值 参数估计的主要方法 由样本统计量来估计总体参数有两种方法: 点估计 区间估计 点估计( point estimation ) 根据样本统计量确定总体参数的一个数值(均值、标准差、比例等) 。常用点估计有: 比如,若根据随即抽样的样本计算出来的公司职员的月工资收入为1万元,则用1万元作为全公司职员月平均收入的一个估计值 区间估计(Interval estimate)(I) 通过统计推断找到包括样本统计量在内(有时是以统计量为中心)的一个区间 鉴于总体参数与样本均值的分布特点,该区间很可能包含总体参数 无论研究的总体是否服从正态分布,样本均值一定服从正态分布 区间估计(Interval estimate)(II) 样本的均值分布(I) 由样本均值的抽样分布可知,在重复抽样或无限抽样的情况下,样本均值的数学期望等于总体均值: 样本均值的抽样标准误差为: 于是,样本的抽样分布即为: 由此可知,样本均值落在总体均值的两侧各为一个抽样标准差范围内的概率为0.6827,两个标准差范围内的概率为0.9544,三个标准差范围内的概率为0.9973 区间估计(Interval estimate)(II) 样本的均值分布(II) 可以求出样本均值 落在总体均值 μ 的两侧任何一个抽样标准差范围内的概率 但实际估计时,情况恰恰相反: 是已知的,μ 是未知的,也是需要估计的 由于 μ 与 的距离是对称的,如果某个样本的平均值落在μ的两个标准差范围内,则 μ 也被包括在以 为中心左右两个标准差的范围内 因此,约有95%的样本均值会落在μ的两个标准差的范围之内。换言之,约有95%的样本均值所构造的两个标准误差的区间会包括 μ 抽取100个样本估计总体的均值,由100个样本所构成的100区间中,约有95个区间包含 μ ;另5个区间不包含 μ 区间估计(Interval estimate)(II) 样本的均值分布(III) ????样本均值( )在( , )范围内的概率为 68.27% ????样本均值( )在( , )范围内的概率为 95.44% ????样本均

文档评论(0)

别样风华 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档