常用的描述统计方法秦娟.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

*下一步*SPSS运行结果表1-310名高中生高考分数

(按重点线与非重点线划分)与数学高考成绩*【分析】高考分数和数学成绩均是连续性随机变量,其中变量X高考分数被人为地根据一定的标准划分成为重点线与非重点线两类。所以,适合运用二列相关系数来计算二者之间的相关。当p=0.4,即正态分布图0.1的面积所对应的Y值,查正态分布表知,Y=0.39876*特别说明:在人为二分变量缺失原始数据或划分标准情况下,无法运用SPSS进行二列相关系数的计算。即:SPSS并无单独的二列相关系数计算程序。*谢谢!*********应提供解决方案**拓展:集中量的SPSS操作**下一步*下一步*SPSS运行结果比较下列两组数据76,77,75,70,72,7498,21,60,95,70,100*两组数据均值都是74,能表明这两组数据的水平一样吗?*差异量是反映一组数据差异程度或离散程度的量。差异量A全距B离均差C方差D标准差*全距:计算简便,但其易受两极端值影响,由于不考虑中间值的差异,反应不太灵敏,大多时候是作为差异量的粗略估计。A全距或*离均差:意义明确,计算简便,且每个数据都参与运算,反应灵敏;但是由于受到绝对值的限制,不适合进一步的代数运算,因此在推断统计中较少应用。B离均差*方差与标准差:反应灵敏,严密确定,计算简单,适合代数运算。缺点是不容易理解,易受极端值影响,且数据不完整或模糊不清时,无法进行计算。当一组数据的集中量用平均数表示时,其差异量用方差或标准差来表示。C方差D标准差计算下列一组数据40,50,50,60的全距、离均差、方差和标准差。*案例【分析】*拓展:差异量的SPSS操作**下一步*下一步*SPSS运行结果说明:SPSS计算标准差、方差与手工计算方式有略微差异。*统计学中,将两个变量(或多个变量)之间不精确、不稳定的变化关系称为相关关系,而用于描述两个变量之间变化方向及密切程度的数字特征量称为相关系数。相关量相关系数的类型ABC积差相关系数等级相关系数质量相关系数斯皮尔曼等级相关系数肯德尔和谐系数点二列相关系数二列相关系数多列相关系数适用条件是:两个变量都是连续性随机变量;两个变量所对应总体都呈正态分布,或近似接近正态分布;两个变量取值一一对应;两个变量之间呈线性关系。*A积差相关系数皮尔逊积差相关系数*斯皮尔曼等级相关系数*适用条件:不要求变量服从正态分布,两个变量是顺序或等级水平即可。二列相关系数*适用条件:两个变量都是正态连续变量,且线性相关,其中一个变量被人为地基于主观标准划分为二分变量。根据变量的数据类型,分别计算下列各表(表1-1、表1-2、表1-3)中两两变量之间的相关系数。为了举例运算的方便,表中所列数据在数量上均进行了简化,实际数据则远比例题中的数据复杂。*案例表1-110名初中生的智力测试分数与中考数学成绩*【分析】智力分数X和数学成绩Y两个变量都是连续性随机变量,且均服从正态分布,所以计算二者的相关,应选择皮尔逊积差相关系数,计算过程见下表所示。*拓展:皮尔逊积差相关系数的SPSS操作**下一步*下一步*SPSS运行结果表1-210名大学生笔试成绩与面试成绩【分析】笔试成绩与面试成绩均属于连续性随机变量,但是笔试成绩和面试成绩总体并未确定是否服从正态分布,所以需要将数据转换成等级类型,计算二者的相关,运用斯皮尔曼等级相关系数。计算过程如下所示。*拓展:斯皮尔曼等级相关系数的SPSS操作**下一步常用的描述统计方法主讲人:秦娟讲师数据初步整理的三种方式01制作统计表02绘制统计图03描述统计计算特征量集中量相关量差异量计算特征量*集中量是反映一组数据典型水平或集中趋势的量。集中量A算术平均数B加权平均数C中位数D众数适用条件:数据属于连续性类型,一组数据准确、完整,无极端数值或模糊数据。A算术平均数*适用条件:当一组数据需要权衡不同数值的地位或作用时,则应考虑运用加权平均数。B加权平均数*适用条件:一组数据有极端数值,或存在不确定、模糊数据时,则应考虑使用中位数。C中位数一组数据排序之后位于中间位置的数。*适用条件:当需要快速且粗略地找出一组数据的代表值时。D众数一组数据出现次数最多的数。某小组10名同学某次数学测验的分数分别为72,78,85,82,70,90,

文档评论(0)

152****8232 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档