- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7数据资料的整理和分析.ppt
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1.4 加权平均数 对于样本容量≥30且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数。 xi — 第i组的组中值 fi — 第i组的次数 k — 组数 采用加权法计算得到的平均数就称为加权平均数(weighted mean) 加权平均数不具备算术平均数的两个性质 下一张 主 页 退 出 上一张 组别 组中值 x 次数 fx 10- 15 3 45 20- 25 6 150 30- 35 26 910 40- 45 30 1350 50- 55 24 1320 60- 65 8 520 70- 75 3 225 合计 100 4520 【例】将100头仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。 仔猪一月窝重次数分布表 下一张 主 页 退 出 上一张 利用式得: 即这100头长白母猪仔猪一月龄平均窝重为45.2kg。 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。 下一张 主 页 退 出 上一张 下一张 主 页 退 出 上一张 几何平均数(geometric mean): n个观测值相乘之积的n次方根 ■ 利率、畜禽数的增长率、药物的效价、抗体的滴度等非线性数据,采用几何平均数比用算术平均数更能代表其平均水平。 例1 为研究人群中流感的抗体水平,测得12名儿童的血清对流感病毒的血凝抑制抗体效价的倒数为:5,5,5,5,5,5,5,10,10,10,20,40,试计算平均血凝抑制抗体效价。 解: 答:平均血凝抑制抗体效价约为1∶8 平均血凝抑制抗体效价约为1∶10 2. 几何平均数 下一张 主 页 退 出 上一张 3. 调和平均数 调和平均数(harmonic mean):资料中各观测值倒数的算术平均数的倒数。 ■ 调和平均数主要适用于速度类的资料,或有个别极端大观测值的数据资料。 主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 下一张 主 页 退 出 上一张 当观测值的个数是偶数时,以中间两个观测值的平均数作为中位数 ■ 数据资料呈偏态分布或分布情况不清楚时,中位数的代表性优于算术平均数 4. 中位数 中位数(median):将资料中所有观测值按从小到大依次排列,位于中间位置的那个观测值,简称为中数 下一张 主 页 退 出 上一张 (1)未分组资料中位数的计算方法 下一张 主 页 退 出 上一张 下一张 主 页 退 出 上一张 (2)已分组资料中位数的计算方法 【例】 某奶牛场68头健康母牛从分娩到第一次发情间隔时间 整理成次数分布表如下表所示,求中位数。 下一张 主 页 退 出 上一张 5. 众数 众数(mode):在数据资料中出现次数最多的一个观测值或次数最多一组的组中值 有的资料可出现多个众数,有的资料则没有众数 下一张 主 页 退 出 上一张 所 列 出 的 次数分布表中,57—71这一组次数最多,其组中值为64天,则该资料的众数为64天。 总结 对于同一资料: 算术平均数 几何平均数 调和平均数 上述五种平均数,最常用的是算术平均数。 二 离散性特征值 平均数主要是用来说明数据的集中趋势和集中程度的,是一组数据的代表值。 平均数的代表性如何,还要看数据的变异情况: 数据越是集中, 则平均数的代表性就越强 仅用平均数对一个数据资料的特征进行统计描述是不完善的,还必须要有另外一个统计量来衡量数据变异程度的大小、说明平均数的代表性。 数据越是分散(离散),则平均数的代表性就越差 用来衡量数据变异程度的统计量有很多,常用的有:极差、方差、标准差和变异系数。 下一张 主 页 退 出 上一张 1. 极差 (全距) 极差(range):数据资料中最大观测值与最小观测值之间的差 ■ 极差主要用来说明传染病和食物中毒的最短、最长潜伏期 (1)没有充分利用数据中全部观测值的信息 优点:极差是衡量数据资料变异程度大小的最简便的统计量 缺点: (2)不能准确反映数据中各观测值的分布状况 (3)样本之间难以进行比较 (4)极差的抽样误差较大,不稳定 下一张 主
文档评论(0)