多元统计基本概念复习.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计基本概念复习.doc

多元统计基本概念复习 总体:根据研究目的确定所有同质个体的某指标观察值(或测量值)构成的集合称为总体(population),或更严谨地称为该观察指标(变量)的总体。由于在实际研究中,往往需要观察或测量多个指标,而这些指标之间往往伴有某种关联,故多个观察指标构成了个体的一组观察指标。为了叙述方便,往往简单地称总体是根据研究目的确定同质个体的全体。 总体均数: 总体中所有个体测量值的平均数称为总体均数。总体均数是一个总体的重要特征参数 总体参数:总体均数、总体发生率等总体的特征指标或总体统计指标称为总体参数(parameter)。 未知参数:由于总体往往非常大,有些总体参数无法知道,因此这些无法知道的总体参数称为未知参数。 统计量:用样本表达式构成的样本统计指标估计未知总体参数,这种样本统计指标称为统计量(statistic)并且要求统计量的样本表达式中不含有未知参数。 频率与概率:在n次观察中,其中有m次观察到某现象A,则称观察到现象A的比例为频率(frequency),m称为频数。显然有。频率f是一个统计量,由于个体的变异性,频率f呈一定的随机波动。当观察次数n越来越大,频率f的随机波动幅度越来越小,并最终趋向于一个常数(:观察到现象A发生的概率(称为概率的统计定义)。 概率(probability):概率刻画随机事件发生可能性大小,其取值界于0和1之间。随机事件发生的可能性越小,概率越接近0;随机事件发生的可能性越大,概率越接近1。特别,不可能事件发生的概率等于0,必然事件发生的概率等于1。 在统计学中,如果随机事件发生的概率小于或等于0.05,则认为是一个小概率事件,表示该事件在大多数情况下不会发生,并且一般认为小概率事件在一次随机抽样中不会发生,这就是小概率原理。小概率原理是统计推断的基础。 频率图与概率密度曲线 例 某市1995年110名7岁男童的身高(cm)资料如下,请作频数图和频率图。 121.4 119.2 124.7 125.0 115.0 112.8 120.2 110.2 120.9 120.1 125.5 120.3 122.3 118.2 116.7 121.7 116.8 121.6 120.2 122.0 121.7 118.8 121.8 124.5 121.7 122.7 116.3 124.0 119.0 124.5 121.8 124.9 130.0 123.5 128.1 119.7 126.1 131.3 123.8 116.7 122.2 122.8 128.6 122.0 132.5 122.0 123.5 116.3 126.1 119.2 126.4 118.4 121.0 119.1 116.9 131.1 120.4 115.2 118.0 122.4 120.3 116.9 126.4 114.2 127.2 118.3 127.8 123.0 117.4 123.2 119.9 122.1 120.4 124.8 122.1 114.4 120.5 120.0 122.8 116.8 125.8 120.1 124.8 122.7 119.4 128.2 124.1 127.2 120.0 122.7 118.3 127.1 122.5 116.3 125.1 124.4 112.3 121.3 127.0 113.5 118.8 127.6 125.2 121.5 122.5 129.1 122.6 134.5 118.3 132.8 频率图:以7岁男童身高的频数分布图为例,图中的直方面积大小表示频数的多少,直方面积之和等于总频数。若图形的直方面积大小描述的是频率,则直方面积之和为100%,这样的分布图称为频率分布图。频率图与频数图相似,只是纵坐标的量纲不同。 概率密度曲线:如果本例中的7岁男童人数(n)逐渐增多,各个组段的频率越来越趋向相应的概率,即各个组段的直方面积趋向相应的概率。当组段逐渐细分, 则频率分布图中的直条逐渐变窄, 其顶端逐渐接近一条光滑曲线,这条曲线称为概率密度曲线。曲线下的面积对应的是概率。如果样本频数图呈对称分布,则可以称该样本近似服从正态分布;反之称为偏态分布(如下图)。 正态分布 正态曲线1的=2.4,=0.8;曲线2的=3.4,=0.8;曲线3的=3.4,=1.2。 两个参数:均数(和标准差(,若X服从正态分布,则记为X~N((,(2)。特别(=0,(=1,则称为标准正态分布,记为N(0,1)。 X~N((,(2),令,则Y~N(0,1)。 样本均数的统计性质和分布(用模拟程序说明) 由于个体变异的原因,也呈随机变化 的总体均数与X的总体均数相同 的总体标准差(称为标准误)=(故:) 若X~N((,(2),则

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档