实验五描述性统计分析..doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验五描述性统计分析.

第二篇 数据分析基础 实验五 描述性统计分析 实验目的: 了解相关系数和偏相关系数的计算方法。 实验工具: SPSS描述性统计分析菜单项。 知识准备: 一、统计整理 统计整理是根据统计研究的目的,对统计调查所获得的大量原始资料(初级资料),进行科学的分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。 统计整理的结果为统计表与统计图。统计表主要表现为频数表,而统计图的表现形式多样,前面已经介绍了各种统计图的制作方法,此处不在专门进行介绍。 二、集中趋势的测量 集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。集中趋势主要依赖各种平均指标进行反映。 1、算术平均数 算术平均数又称为均值,其定义为: 设,,…,是取自某总体的一个样本,它的算术平均数 算术平均数有四个重要性质:①各变量值与平均数离差之和等于零;②各个变量值与平均数离差平方和为最小值;③常数的算术平均数是其本身;④对于任何两个变量和,它们的代数和的算术平均数就等于两个变量的算术平均数的代数和。 2、调和平均数 调和平均数是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数。调和平均数的计算公式为: 使用调和平均数要注意三个问题:①变量的取值不能为零,因为零不能作为分母,此时调和平均数无法计算;②调和平均数与算术平均数一样,易受极端值的影响③调和平均数只适用于特殊的数据情况,所以要注意区分它的适用条件。 在SPSS中,调和平均数可以在Report子菜单的4个报表过程中计算输出。 3、几何平均数 几何平均数是个变量值乘积的次方根。凡是现象的连乘积等于现象的总比率或总速度都可用几何平均数来计算它们的平均比率和平均速度。 其计算公式为: 式中: 在SPSS中,几何平均数可以在Report子菜单的4个报表过程中计算输出。 4、众数 众数是一个总体中或分布数列中,出现次数最多的变量值。众数是随机变量的一种位置特征数,在单峰分布场合,众数附近常是随机变量最可能取值的区域,服装、鞋、帽等行业非常重视众数,因为众数就是最普遍、最众多的尺码,生产这种尺码给他们带来的利润最大。 在SPSS中,众数可以在Report子菜单和Tables子菜单的全部报表过程和制表过程中计算输出。 5、中位数 中位数它是把样本中各单位标志值按大小顺序排列,位于数列中点位置的标志值就是中位数。也就是说,数列中有一半单位的标志值小于中位数,另一半单位的标志值大于中位数。 在计算中位数时,首先必须将数据按大小排序,即计算次序统计量。排在中间位置的就是中位数。 设次序统计量为: 其中为最小值,为最大值。 若n为奇数,则第项的标志值就是中位数;若n为偶数,则中位数等于第项的标志值与第项的标志值的简单算术平均数。即: 6、截尾均值 将数据按由小到大顺序排列后,因数据两端的值不够稳定,按一定比例除去数据头尾两端一定数量的观测值,然后再求平均,这样得到的均值就称为截尾均值。 三、离中趋势的测量 变异指标反映的是各变量值远离其中心值的程度,即反映数列中各标志值的变动范围或离差程度。平均指标将数据的数量差异抽象化了,用一个代表数值反映现象的一般水平,反映的是各单位某一数量标志的共性,而不能反映它们之间的差异性。因此仅用平均指标还不能全面描述数据分布的特征,标志变异指标弥补了这个不足,从另一方面说明数据分布的特征,反映的是数据分布的离中趋势。 1、全距 全距又称极差,是最大值与最小值之差。计算公式为: 极差常在小样本的场合使用,而在大样本场合很少在实际中应用。这是因为极差仅使用了样本中两个极端点的信息,而把中间的信息都丢弃了,当样本容量越大时,丢弃的信息也就越多,从而留下的信息过少,其使用价值就不大了。 2、四分位差 是来自某总体的一个样本,其次序统计量为,样本的分位数是指由下式求得的统计量: 上式中的是不超过的最大整数。 样本的分位数表示容量为的样本中约有个数小于。 时,即为样本中位数,另外,在描述数据位置时常用到四分位数,即与的分位数与并常将它们记为与,分别称它们为第一四分位数与第三四分位数,或下四分位数和上四分位数,它反映了有四分之一的数据小于,有四分之一的数据大于,而有一半数据介于与之间。 如果用上四分位数减下四分位数,可得“内四分位间距”或“四分位间距”。这个指标与一般极差的区别在于计算范围较窄,排除了部分极端值对变异指标的影响。但在运用指标进行分析时,人们一般习惯于取四分位间距的一半,称为“四分位差()” Q.D.= 3、异众比 异众比率又称离异比率或变差比,是指非众数组的频数占总频数的比率,其计算公式为: 式中,为异众比率;为变量值的总频数;为众数组的频数。 异众

文档评论(0)

sa1fs5g1xc1I + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档