第5篇参数估计(使用).ppt

  1. 1、本文档共92页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
别生气 你认识很容易生气的人吗?大自然有办法让这些人平静下来:他们比较容易得心脏病。好几项观测研究都发现生气和心脏病之间的相关性,最好的一项研究观察了12986个人,随机选自四个地区,而且都没有心脏病,我们把焦点集中在这个样本当中血压正 常的8474个人身上。 有个简短的心理测验叫做“斯皮尔伯格发怒量表”,度量了每个人容易发怒的程度,结果有633个人,被归类在发怒量表的高水平,4731人在中水平,3110人在低水平。然后追踪这些人将近6年并比较了高水平和低水平得心脏病的比率,最爱生气的和最不爱生气的组比起来,得心脏病的机会是2.2倍,而心脏病猝发的概率是2.7倍。 别生气 听起来生气似乎是很严重的事。对于所有正常血压的人士来说不会是完全正确的。有关这项研究的新闻报道引用这两个数字。但是医学期刊“循环”中的全文中提出了置信区间 。在95%置信水平之下,高水平组得心脏病的慨率,是低水平组的1.36—3.55倍之间,心脏病猝发概率则在1.48—4.90倍之间。区间提醒我们,因为我们只有样本的数据,所以我们对总体的所有叙述都是不确定的。对样本来说,我们可以说:“机会恰好是2.2倍”,对整个总体来说,样本数据只能让我们说:“机会在1.36—3.55倍之间”,而只有95%的信心。 要探讨新闻背后的真相,不论是有关医药行业还是其他领域,我们都必须使用置信区间这种表示方法。 艾滋年代的危险行为 全国艾滋病风险的行为到底多普遍? “全国艾滋病行为调查”访问了2673位成人异性恋者的随机样本。其中有170个人承认,在前一年曾有超过一个的性伴侣占样本的6.36%,这个结果可能有偏差,因为有人不愿意把自己的性行为照实告诉别人,目前就假设样本里的人都说了实话。 根据这些数据,我们对于所有成年异性恋者当中,有不止一个性伴侣者所占的百分比,能下如何的结论呢? 艾滋年代的危险行为 我们的总体是成年异性恋者。参数是在前一年中有不止一个性伴侣者所占比例,我们把这个未知参数叫P,代表比例。用来估计参数P的统计量是样本比例p。 统计推论中的一个基本步骤,就是用样本统计量来估计总体参数。一旦我们取得样本之后,就可以估计所有成年异性恋者中有不止一个性伴侣的比例是“大约6.36%”,因为样本里的比例正是 6.36%。我们只能估计总体的真正情况“大约”是6.36%。 因为我们知道样本结果通常不会和总体的真正比例一模一样。置信区间把这个“大约”具体化了。 第 5 章 参数估计 1 参数估计的一般问题 2 一个总体参数的区间估计 3 两个总体参数的区间估计 4 样本量的确定 参数估计在统计方法中的地位 估计量与估计值 估计量与估计值 (estimator estimated value) 估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值? 的一个估计量 参数用? 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 ?x =80,则80就是?的估计值 点估计 (point estimate) 用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 无法给出估计值接近总体参数程度的信息 虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 如前所述,点估计是用一个点(即一个数)去估计未知参数。顾名思义,区间估计就是用一个区间去估计未知参数,即把未知参数值估计在某两界限之间。例如,估计明年GDP增长在7%~8%之间,比说增长8%更容易让人们相信,因为给出7%~8%已把可能出现的误差考虑到了。 区间估计 现今最流行的一种区间估计理论是统计学家J.Neyman在20世纪30年代建立起来的,现叙述如下。 区间估计 置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率,例如α=0.01或1%,是说总体指标在置信区间内,平均100次有1次会产生错误。 区间估计    关于置信度,在统计学中进行区间估计时,按照一定要求总是先定好标准,通常采用三个标准。p134    当然,在进行区间估计时,必须同时考虑置信概率与置

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档