SPSS基本统计说课.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学习目标及内容: 掌握SPSS频数分析的基本方法及其操作 明确基本描述统计量的含义,并掌握其操作 掌握交叉列联分析的基本方法,了解卡方检验的基本思想,并熟练操作 掌握对多选项问题的不同拆分方法和应用场合,并能用于数据分析 四分位差(也称内距或四分位距) 它是上四分位数(QU,即位于75%)与下四分位数(QL,即位于25%)。计算公式为:Qd =QU-QL 四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。 四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。 案例:分析人均住房面积的分布情况,并对本市户口和外地户口家庭进行比较 展示所有样本的四分位数:在变量【variable(s)】中选择“人均面积”,在【statistics】中选择四分位数【quartiles】即可。 4.2.1 基本描述统计量 一、刻画集中趋势的描述统计量 集中趋势是指一组数据向某一中心值靠拢的倾向。 (1)均值(Mean):即算术平均数,是反映某变量所有取值的集中趋势或平均水平的指标。如某企业职工的平均月收入。其计算公式为: (2)中位数(Median):即一组数据按升序排序后,处于中间位置上的数据值。如评价社会的老龄化程度时,可用中位数。 (3)众数(Mode):即一组数据中出现次数最多的数据值。如生产鞋的厂商在制定各种型号鞋的生产计划时应该运用众数。 (4)均值标准误差(Standard Error of Mean):描述样本均值与总体均值之间的平均差异程度的统计量。其计算公式为: 二、刻画离散程度的描述统计量 离散程度是指一组数据远离其“中心值”的程度。 如果数据都紧密地集中在“中心值”的周围,数据的离散程度较小,说明这个“中心值”对数据的代表性好;相反,如果数据仅是比较松散地分布在“中心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有代表性的。 常见的刻画离散程度的描述统计量如下: (1)全距(Range):也称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对离差。 (2)样本方差(Variance):也是表示变量取值离散程度的统计量,是各变量值与算术平均数离差平方的算术平均数。其计算公式为: (3)样本标准差(Standard Deviation:Std Dev):表示变量取值距离均值的平均离散程度的统计量。其计算公式为: 标准差值越大,说明变量值之间的差异越大,距均值这个“中心值”的离散趋势越大。 三、刻画分布形态的描述统计量 数据的分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等。 刻画分布形态的统计量主要有两种: (1)偏度(Skewness):描述变量取值分布形态对称性的统计量。其计算公式为: 当分布为对称分布时,正负总偏差相等,偏度值等于0; 当分布为不对称分布时,正负总偏差不相等,偏度值大于0或小于0。 偏度值大于0表示正偏差值大,称为正偏或右偏; 偏度值小于0表示负偏差值大,称为负偏或左偏. 偏度绝对值越大,表示数据分布形态的偏斜程度越偏大。 (2)峰度(Kurtosis):描述变量取值分布形态陡峭程度的统计量。其计算公式为: 当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0; 峰度大于0表示数据的分布比标准正态分布更陡峭,为尖峰分布; 峰度小于0表示数据的分布比标准正态分布平缓,为平峰分布。 一、交叉列联表的卡方检验 卡方检验属假设检验的范畴,步骤如下: 第一步,建立原假设(H0) H0表示行变量与列变量相互独立 第二步,计算检验统计量pearson卡方的值 该统计量服从(r-1)?(c-1)个自由度的卡方分布 第三步,确定显著性水平和临界值 α为弃真概率(拒绝概率), α=0.01或0.05 一、多选项问题的分解 两种分解方法: 1.多选项二分法 是将多选项问题中的每个答案设为一个SPSS变量,每个变量只有0或1两个取值,分别表示选择了该答案和不选择该答案。 例如,高考志愿的调查中,志愿选择有6个答案,(1)北大;(2)清华;(3)人大;(4)北京理工;(5)北师大;(6)北外。对应设置6个SPSS变量,取值为1或0。 问题2:您择业中考虑的主要因素有(限选三项) 1经济收入

文档评论(0)

w5544434 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档