[高等教育]信息分析与决策Chapert4-1 抽样与统计推断1-估计与参数检验.ppt

[高等教育]信息分析与决策Chapert4-1 抽样与统计推断1-估计与参数检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[高等教育]信息分析与决策Chapert4-1 抽样与统计推断1-估计与参数检验

第四章 样本数据的统计分析 在实际问题中,人们常常可以大致判断出总体分布的类型,但却难以直观地判断出总体分布的参数(均值,方差等)。这就需要用样本来推断总体分布的这些参数,即所谓的参数估计。 参数估计 4.1 估计 参数估计Estimation,即运用抽样数据来估计总体参数的值。分为点估计(Point estimates)和区间估计(Interval estimates). 4.1.1 点估计 点估计,用样本的某一函数值来估计总体分布中的未知参数。 4.1.1 点估计 每个点估计都与总体参数不同,若估计量的期望值等于总体参数,则这个估计量被称为无偏估计量。否则,则是有偏的。上表中的估计量都是无偏的。因此关于总体参数的有关决策也都是由意义的。 4.1.1 点估计 4.1.1 点估计 Ex: 不同年龄组的人周看电视的统计数据 Age Group Sample Mean Sample Deviation Std. Deviation 18-24 60.16 101.91 10.09 25-34 70.28 97.06 9.85 35-44 67.40 40.30 6.35 45-54 89.06 122.36 11.06 55-64 95.93 175.57 13.25 65+ 117.05 32.37 5.69 18-24年龄组看电视均值小于25-34年龄组的人,但却有较大的标准差和方差。65岁以上的人的看电视时间最多,但方差最小。是否能够直接用这些点估计的值解释说明问题? 4.1.2 区间估计 即使是无偏的点估计,在一次估计中,都与总体参数(真值)有偏差。所谓“无偏”,是指在大量重复抽样基础上的均值,是无偏的。因此,需要估计点估计对总体参数的偏差。即,根据估计量的分布,在一定概率下,给出总体参数的可能范围。 置信区间 若总体分布含一个未知参数,找出了两个依赖于样本Xi(i=1,2,…,n) 的估计量1 2使, P(1  2) = 1- 其中(0,1),则称随机区间(1,2)为的100(1-)%的置信区间。百分数100(1-)%称为置信度。 均值的置信区间 均值的置信区间 方差的置信区间 比例的置信区间 某类个体数量占总体数量的比例问题是社会科学,自然科学领域中机场遇到的问题。Ex, 高收入人数的比例 开展电子商务的企业的比例 某种药物有疗效的比例 因此,具有不同特征的个体数量的比例问题,是我们研究一个系统(特别是包含人的系统) 结构的基本问题。 比例的置信区间 比例的置信区间 比例的置信区间 比例的置信区间 比例的置信区间 Ex: 如果1000(n=1000)个选民的样本,在两个候选人的角逐中,有51%(π=51%)的选票支持候选人A,则置信度为90%(a/2=0.05)的置信区间为: 比例的置信区间 若样本足以代表总体投票的情况,则倾向于候选人A的选民的比例在48.4%到53.6%之间的可能性为90%。这意味着尽管点估计表明了投票的多数情况51%,但由于样本数据的不确定性,真实的支持比例可能低于50%。 4.1.3 置信区间与样本量 在关于置信区间的所有公式中,样本量对于决定区间大小起关键性作用。在抽样研究前,往往需要确定抽取样本的大小,从而在设定的精确水平的范围内估计总体参数。 4.1.3 置信区间与样本量 4.1.3 置信区间与样本量 4.1.3 置信区间与样本量 4.2 假设检验 4.2.1 假设检验的基本概念 假设检验分为参数检验与非参数检验 参数检验:已知总体分布且猜到总体的某个参数(假设H0),用一组样本来检验这个假设,是否正确(接受还是拒绝假设H0) 非参数检验:猜出总体分布(假设H0),用一组样本来检验这个假设,是否正确。 4.2.1 假设检验的基本概念 Ex: 生产线上生产出来的零件,已知零件的直径服从正态分布,抽取4个样本,直径分别为(10.1,9.9,9.91,10.09),其样本的均值为10。 我们推断总体的均值也为10. 这个推断是否正确? 我们需要另外一组样本来检验。 4.2.1 假设检验的基本概念 4.2.2 正态总体下参数假设检验 4.2.2 正态总体下参数假设检验 4.2.2 正态总体下参数假设检验 若统计量在(-k,k)之间,则接受假设H0, 若在k的外侧,则拒绝假设H0 4.2.2 正态总体下参数假设检验 假设检验的等价判别方法: 对于双尾检验定义统计量z的等价的p值为 p = 2*(1-P(Zz)), 若z 不在拒绝域内 Zϵ(-Za/2,Za/2), 等价于p a, 这种情况下, 即接受假

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档