网站大量收购闲置独家精品文档,联系QQ:2885784924

第二章数据资料的特征值.ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据资料的特征值 生物学数据资料(观测值)的分布具有两个重要的特征: 第一节 集中性特征值 1. 算术平均数 * 离散性特征值 集中性特征值 集中性 离散性 观测值向中心位置聚集的趋势 反映数据资料集中性的特征值是平均数 观测值偏离中心位置的分散情况 反映数据资料离散性的特征值是极差、方差、标准差和变异系数等 众数 算术平均数 几何平均数 调和平均数 中位数 平均数(mean)是统计学中最常用的统计量,用来表明数据中各观测值相对集中较多的中心位置,反映了一组观察值的平均水平,是一组数据资料的代表值 ◇ 可以用来说明一组数据资料的平均水平或集中趋势,具有典型性 ◇ 可以用来进行组间比较,以判断一组数据资料与另一组数据资料的差别,具有代表性 平均数的作用: 算术平均数(arithmetic mean):数据资料中各观测值的总和除以观测值的个数所得的商,简称平均数或均数。记为 1.1 基本概念 ■ 算术平均数适合描述对称分布资料的集中趋势 1.2 计算公式 观测值为 :x1,x2,…,xn,则: 对于总体来说,则有: 设有一随机变量x, 1.3 重要性质 样本各观测值与平均数之差的和为0,即离均差之和为0 证 明 样本各观测值与平均数之差的平方和为最小,即离均差平方和最小 证 明 则有: 1.4 加权平均数 对于样本容量≥30且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数 xi — 第i组的组中值 fi — 第i组的次数 k — 组数 采用加权法计算得到的平均数就称为加权平均数(weighted mean) 加权平均数不具备算术平均数的两个性质 几何平均数(geometric mean): n个观测值相乘之积的n次方根 ■ 适用于利率、畜禽数的增长率、药物的效价、抗体的滴度等非线性数据 例1 为研究人群中流感的抗体水平,测得12名儿童的血清对流感病毒的血凝抑制抗体效价的倒数为:5,5,5,5,5,5,5,10,10,10,20,40,试计算平均血凝抑制抗体效价。 解: 答:平均血凝抑制抗体效价约为1∶8 平均血凝抑制抗体效价约为1∶10 2. 几何平均数 3. 调和平均数 调和平均数(harmonic mean):资料中各观测值倒数的算术平均数的倒数 ■ 调和平均数主要适用于速度类的资料,或有个别极端大观测值的数据资料 4. 中位数 中位数(median):将资料中所有观测值按从小到大依次排列,位于中间位置的那个观测值,简称为中数 5. 众数 众数(mode):在数据资料中出现次数最多的一个观测值或次数最多一组的组中值 有的资料可出现多个众数,有的资料则没有众数 当观测值的个数是偶数时,以中间两个观测值的平均数作为中位数 ■ 数据资料呈偏态分布或分布情况不清楚时,中位数的代表性优于算术平均数 第二节 离散性特征值 平均数主要是用来说明数据的集中趋势和集中程度的,是一组数据的代表值 平均数的代表性如何,还要看数据的变异情况: 数据越是集中, 则平均数的代表性就越强 仅用平均数对一个数据资料的特征进行统计描述是不完善的,还必须要有另外一个统计量来衡量数据变异程度的大小、说明平均数的代表性 数据越是分散(离散),则平均数的代表性就越弱 用来衡量数据变异程度的统计量有很多,常用的有:极差、方差、标准差和变异系数 1. 极差 极差(range):数据资料中最大观测值与最小观测值之间的差 ■ 极差主要用来说明传染病和食物中毒的最短、最长潜伏期 (1)没有充分利用数据中全部观测值的信息 优点:极差是衡量数据资料变异程度大小的最简便的统计量 缺点: (2)不能准确反映数据中各观测值的分布状况 (3)样本之间难以进行比较 (4)极差的抽样误差较大,不稳定 2. 方差 极差:仅用全部观测值中较为特殊的两个点值,比较粗糙 充分利用数据资料中的每一个观测值,将每一观测值都和某一个特定的值相比, 可以求出每一个观测值与平均数的差值,即离均差 有多少个观测值就可以得到多少个离均差,还是不能说明整个数据资料的变异程度 将各个离均差相加是最简单的方法, ■ 可以用离均差平方和来衡量数据的变异程度 仅仅进行简单地相加,还是不能反映数据资料中所有观测值的总偏离程度 最理想的特定值就是平均数 根据平均数的第二个性质可知,离均差平方和最小,也就是说将离均差平方后相加之和是最稳定的一个值,而且这个值不等于0 离均差平方和简称为平方和(sum of squares),用SS表示 样本平方和: 总体平方和: 用平方和衡量数据的变异程度: 离均差平方和消除了离均差正、负值的影响 离均差平方和的大小除了与变异程度有关外,

文档评论(0)

jdy261842 + 关注
实名认证
内容提供者

分享好文档!

1亿VIP精品文档

相关文档