资料的统计分析单变量分析概述.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(3)中位数(Median) ③由组距分组资料求中位数 具体方法是: 先列出累计频数,然后按同样的方法确定中位数 所在的组,最后利用下述公式计算出中位数的值. L为中位数所在组的下限值. Cf(m -1)为中位数所在组以上的累计频数,为fm为中位数所在组的频数,i为中位数所在组的组距.(以表4为例) 第三十一页,共七十九页。 (3)中位数(Median) 中位数特点: 不受极端值的影响 主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,各变量值与中位数的离差绝对值之和最小,即 第三十二页,共七十九页。 (4)中位数与平均数的比较 平均数要求计算所有的数值,而中位数只用到数值的相对位置,一般说平均数比中位数利用了更多的信息,更全面和准确. 平均数容易受到极端值的影响,中位数则不会受到这种影响. 平均数是一种比中位数更为稳定的量度,它随样本的变化比较少. 平均数要求定距以上变量,中位数要求定序以上变量. 第三十三页,共七十九页。 3、离散趋势分析 含义:指用一个特别的数值来反映一组数据相互之间的离散程度。 作用: ①与集中量数一起,共同反映资料分布的全面特征 ②对相应的集中量数的代表性作补充说明。 常见的离散量数统计量有全距、标难差、异众比率、四分位差等。其中,标准差、异众比率、四分位差分别与平均数、众数、中位数相对应,判定和说明平均数、众数、中位数代表性的大小。 第三十四页,共七十九页。 3、离散趋势分析 离散程度的描述统计量 适用条件:主要用于数值型数据 (1)全距(极差)(Range) 定义:一组数据的最大值与最小值之差. 计算公式: 第三十五页,共七十九页。 第三十六页,共七十九页。 3、离散趋势分析 全距的特征: 离散程度的最简单测度值 易受极端值的影响 未考虑数据的分布 意义: 极差越大,在一定程度上说明这组数据的离散程度越大,集中量数的代表性越低。 第三十七页,共七十九页。 3、离散趋势分析 (2)标准差:Standard Deviation一组数据对其平均数的偏差的平方的算术平均数的平方根。(方差的算术平方根) 例4、某校3个系各选5名同学,参加智力竞赛,他们的成绩分别如下: 中文系:78、79、80、81、82 数学系:65、72、80、88、95 英语系:35、78、89、98、100 第三十八页,共七十九页。 标准差的计算 A.根据原始资料计算 B.单值分组数据资料计算 C.组距分组资料计算:先计算出各组的组中值,然后按单值分组资料计算公式和方法计算即可。 第三十九页,共七十九页。 家庭规模 户数 2人 10 3人 120 4人 50 5人 20 合计 200 第四十页,共七十九页。 2×10+3×120+4×50+5×20 X= =3.4人 200 第四十一页,共七十九页。 家庭规模 户数 X-X (X-X)2 (X-X)2f 2人 10 -1.4 1.96 19.6 3人 120 -0.4 0.16 19.2 4人 50 0.6 0.36 18 5人 20 1.6 2.56 51.2 合计 200 108 第四十二页,共七十九页。 (3)异众率Variation Ratio 含义:一组数据中非众数的次数相对于总体全部单位的比率。 计算表2、表3的异众率。 第四十三页,共七十九页。 150-50 VR= =0.67=67% 150 第四十四页,共七十九页。 异众比率的意义与作用 意义:众数所不能代表的其他数值,即非众数的数值在总体中的比重. 作用:异众比率越大,即众数所不能代表的其他数值在总体中的比重越大时,众数在总体中所占的比重自然越小,众数的代表性越小. 反之,异众比率越小,即众数所不能代表的其他数值在总体中的比重越小,众数的代表性越大. 第四十五页,共七十九页。 (4)四分位差Interquartile Range 先将一组数据按大小排列顺序,然后将其4等分,去掉序列中最高的1/4和最低的1/4,仅就中间的一半数值来测定序列的全距。 Q1的位置(第一个四分位点)=(n+1)/4 Q3的位置(第三个四分位点)=3(n+1)/4 QD=Q3-Q1 第四十六页,共七十九页。 计算四分位差的方法 (1)对原始资料: 例:调查11位同学的年龄如下:17岁、18岁、1

文档评论(0)

虾虾教育 + 关注
官方认证
内容提供者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档