第二章的整理技巧.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Σ的性质 1. 分类资料:每个类别在某个指标上取相同的值。 2. 计数资料和连续性资料:频率分布表 加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。 二、加权法计算 一、直接法计算 xi = 变数值 fi =变数值xi出现的频数“权” 计算公式: 二、加权法 (一)离均差之和为零: 一个样本观察值与平均数之差简称离均差。 ∑(xi- ) =(x1- )+(x2- )+……+(xn- ) = x1+x2+……+xn-n? = ∑xi- n?∑xi/n = 0 三、算术平均数的性质 (二)离均差平方和最小: 一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。 所以:平均数是与各个观察值最接近的数值。 平均数代表这个样本的集中趋势。 定义:n个非负数的乘积开n次方的根称为几何平均 数,用 G 表示。 2 几何平均数 为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。 几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。 能够消弱数据中个别过分偏大值的影响。 定义:各观察值倒数的算术平均数的倒数 5 调和平均数 适用于极端右偏态 例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。 由于数据极端右偏态,用调和平均数较为合理。 定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。 4 中位数(Md) 对于频数分布的资料,公式如下: Lmd:中位数所在组的组下限; fm:中位数所在组的频数; C:从第一组到中位数所在组前一组的累计频数 n:样本含量; i:组距; 定义:在资料中某一个变数出现次数最多,就称 之为众数。 1. 离散性资料:出现频数最多的数。 2. 连续性资料:频数分布表中,频数出现最多的 一组的组中值。 !!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。 5 众数 各个集中趋势度量指标之间的关系 在完全对称分布情况下,算数平均数、中位数 和众数三者相等。 在微偏态分布中,众数与中位数及算术平均数三者之间存在以下关系: 一组数据中的几何平均数、算术平均数、调和平均数之间存在 1 * 评价: 必须有严格的定义及算法 计算过程中应利用全部观察值 简单明了,容易领悟,容易计算 受抽样变动影响不大,即抽样误差小 适用于代数方法处理 能最好的满足上述标准。 1、算术平均数 但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。 偏态:是指大部分的数值落在平均数的哪一边,若分配较多的在低值的方面,视为正偏态,也称右偏态 满足条件②③ 适用于非参数检验,如卡方检验。 4、几何平均数和调和平均数 满足条件①②⑤,适用于右偏态分布。 2、中位数 3、众数 满足条件③,日常生活中经常用到 平均数的代表程度与样本的变异程度有关 一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。 2.7离散趋势的度量 即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。 产仔数 总和 甲 8,4,16,12,22,17,6,14,6,5 110 11 乙 14,8,11,9,11,12,10,14,13,8 110 11 1.如果各个变数相同或者变异程度比较小,则平 均数能够代表整个样本。 2.如果各个变数的变异程度比较大,则平均数的代 表性就小。 因此,单靠平均数不能全面、正确地了解样 本。也不能了解平均数作为样本的变异程度。 如果一个样本有n个观察值 x1,x2 …… xn,设其算术平均数为 ,则该样本的标准差为: 标准差考虑了每个变数与平均数的离差。 每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。 因此,标准差是离散程度的度量 1 标准差的定义 1.离均差=(x- ) 2.离均差之和= ∑(x- )=0 3.离均差平方和 SS= ∑(x- )2 为了合理地计算平均差异,用平方和的办法来消除离均差的正负号,离均差平方相加,得到平方和(SS),但是由于不同样本的观察值个数不同,所以离均差平方和也不是理想指标 虽然离均差可以衡量变异程度,但是离均差之和为0,所以不是理想的

文档评论(0)

a336661148 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档