- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章__资料的整理与初步分析
五、众 数 资料 中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。 如表2-3 所列 的 50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数为22天。 又如 【例3.6】 所 列 出 的 次数分布表中,57—71这一组次数最多,其组中值为64天,则该资料的众数为64天。 下一张 主 页 退 出 上一张 对于同一资料: 算术平均数几何平均数调和平均数 上述五种平均数,最常用的是算术平均数。 二、离散程度的度量 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。 甲品种小麦麦穗粒数 13 14 15 17 18 18 19 21 22 23 平均数18 乙品种小麦麦穗粒数 16 16 17 18 18 18 18 19 20 20 平均数18 两个平均数的代表性有差异吗? 谁的变异幅度大?谁的平均数更具有代表性? 甲 极差=23-13=10 乙 极差=20-16=4 下一张 主 页 退 出 上一张 平均数是度量数据趋中性的,是一组数据的典型代表,不同数据资料整体水平如何,常常是用平均数去比较。但不同数据资料,其平均数的代表性否一样呢? 例如下面的两组人: 24岁 26岁 25岁 25岁 49岁 1岁 因此单用平均数还不足以很好地描述一组数据的主要特征 两组人的平均年龄都是25岁,你能说这两人都是青年人吗? 平均数的局限性 离散程度的特征值(变异数) 仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。 一、变异数的作用及其与平均数的关系 1、作用:变异数主要用来度量数据资料的离散程度 2、变异数与平均数的关系:对同一组资料来说,变异程度越小,平均数的代表性越好;变异程度越大,平均数的代表性越差 离散程度的特征值(变异数)的种类 1、 极差(range):R=X(max)-X(min) 全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,只考虑了数据中的两个极端值,没有充分利用资料提供的全部信息,而且极端值往往是数据中最不可靠的观测值,所以不能准确表达资料中各观测值的变异程度,比较粗略。 当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 下一张 主 页 退 出 上一张 2、方差、均方 为了正确反映资料的变异程度,较合理的方法是根据样本全部观察值来度量资料的变异程度。这时要选定一个数值作为共同比较的标准。为了准确地表示样本内各个观测值的变异程度,首先会考虑到以平均数为标准。平均数既作为样本的代表值,则以平均数作为比较的标准较为合理。也即求出各个观测值与平均数的差异,即( ),称为离均差。如果把这些差值加在一起,得该组所有观测值总变异度应为Σ( ),数值大的就说明这组数据离散程度大,听起来似乎比较合理。但是所有的离均差之和为零,因而不能用离均差之和来表示资料中所有观测值的总偏离程度。 下一张 主 页 退 出 上一张 为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值 ,再求各离均差绝对值之和Σ| |。虽然绝对离均差可以表示资料中各观测值的变异程度,但由于绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。 采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。 先将各个离均差平方,即 ( )2 ,再求 离均差平方和,即 ,简称平方和,记为SS; 上例:第一组:SS1 = (24-25)2 + (25-25)2 +(26-25)2 = 2 第二组:SS2 =(1-25)2 +(25-25)2 +(49-25)2 = 1152 很显然第二组的变异程度大于第一组 当两组资料中观测值的数目不等时,用平方和来表示数据资料的变异性是否有局限性呢? 下一张 主 页 退 出 上一张 当两组资料中观测值的数目不等时,用平方和来表示数据资料的变异性是否有局限性呢? 例:现在有2个班,I班有22位同学,II班有50位同学,以身高作为考查指标,用SS来比较哪班同学身高的离散程度大,若哪班同学身高的离散程度大就发给哪班同学每人一张电影票。试问,是I班同学
文档评论(0)