次数分布和平均数、变异数案例.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一节 总体及其样本 4 、变数( variable ) :观察值集合起来,称为总体的变数。变数又称为随机变数(random variable)。 三、算术平均数的重要特性 (1) 样本各观察值与其平均数的差数(简称离均差,deviation from mean)的总和等于0。即: (2) 样本各观察值与其平均数的差数平方的总和,较各个观察值与任意其他数值的差数平方的总和为小,亦即离均差平方的总和最小。这个问题可作这样的说明,设Q为各个观察值与任意数值a的差数平方的总和,即: 对此Q求最小值,可得使Q最小的a 值为平均数。 四、总体平均数 总体平均数用 来代表,它同样具有算术平均数所具有的特性。 (3·4) 上式yi 代表各个观察值,N代表有限总体所包含的个体数, 表示总体内各个观察值的总和。 平均数是度量数据趋中性的,是一组数据的典型代表,不同数据资料整体水平如何,常常是用平均数去比较。但不同数据资料,其平均数的代表性否一样呢? 例如下面的两组人: 24岁 26岁 25岁 25岁 49岁 1岁 因此单用平均数还不足以很好地描述一组数据的主要特征 两组人的平均年龄都是25岁,你能说这两人都是青年人吗? 第四节 变异数 平均数的局限性 一)极差(range):R=Max(y)-Min(y) 上例中: 第一组数据的极差为:R1 = 26-24 = 2 第二组数据的极差为:R2 = 49-1 = 48 用极差度量数据资料变异大小的局限性:极差只考虑了数据中的两个极端值,没有充分利用资料提供的全部信息,而且极端值往往是数据中最不可靠的观测值,因此用极差来表示数据资料的变异具有明显的局限性,一般只在观测值较少的情况下使用。 第四节 变异数 一、变异数的作用及其与平均数的关系 1、变异数的作用:变异数主要用来度量数据资料的离中性 2、变异数与平均数的关系:对同一组资料来说,变异程度越小,平均数 的代表性越好;变异程度越大,平均数的代表性越好 二、变异数的种类 为了解决资料中所有观测值的离均差正负抵消的问题,采用先平方后再相加的办法。 数据资料的变异取决于观测值的离散程度,这自然会联想到所有观测值离均差的大小,如果把这些差值加在一起,数值大就说明这组数据离散程度大,听起来似乎比较合理,但是我们由平均数的第一个性质知道: 用什么特征数来表示数据资料的变异大小比较合理呢? 第四节 变异数 离均差平方和: 上例中:第一组数据的平方和为:SS1 = (24-25)2 + (25-25)2 +(26-25)2 = 2 第二组数据的平方和为:SS2 = (1-25)2 + (25-25)2 +(49-25)2 = 1152 当两组资料中观测值的数目不等时,用平方和来表示数据资料的变异性是否有局限性呢? 例如现在有2个班,I班有22位同学,II班有30位同学,以身高作为考查指标,用SS来比较哪班同学身高的离散程度大,若哪班同学身高的离散程度大就发给哪班同学每人一张电影票。试问,是I班同学有意见还是II班同学有意见? 这不公平,因为II班人数多。 I班 因此必需消除样本容量对离均差平方和的影响,这就需要引入另外一个特征数-方差 * * 第三章 次数分布和平均数、变异数 第一节 总体及其样本 第二节 次数分布 第三节 平均数 第四节 变异数 1、数据:指在生物学试验或调查中,对研究对象的某些特 征或性状进行观察记载得到的数字资料 2、总体( population ) :指具有共同性质的所有个体组成的集团 有限总体:总体所包含的个体数目有无穷多个 . 无限总体:由有限个个体构成的总体. 总体容量:指总体中所包含的个体数目。用N 表示。 3、观察值(observation) :指每一个体的某一性状、特性的测定数值。 5 、样本( sample ) :从总体中抽取若干个个体的集合称为样本(sample)。 6 、统计数( statistic ) :测定样本中的各个体而得的样本特征数,如平均数等,称为统计数(statistic)。 7 、随机样本( random sample ) :从总体中随机抽取的样本称为随机样本(random sample) 8、样本容量 ( sample size ) :样本中包含的个体数称为样本容量或样本含量(sample size) 用n 表示。 第二节 次数分布 一、试验资料的性质与分类 二、次数分

文档评论(0)

知识宝库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档