实验描述性统计分析.docVIP

实验描述性统计分析.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验描述性统计分析

实验四 描述性统计分析 一、集中趋势的测度 定类数据:众数 定序数据:中位数和分位数 定距和定比数据:均值 众数、中位数和均值的比较 一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据一般水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定 众数(Mode) 集中趋势的测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 主要用于定类数据,也可用于定序数据和数值型数据 中位数(Median) 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响 主要用于定序数据,也可用数值型数据,但不能用于定类数据 各变量值与中位数的离差绝对值之和最小,即 四分位数(Quartiles) 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 3. 不受极端值的影响 4. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据 均值(Mean) 1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于定类数据和定序数据 众数、中位数和均值的关系 二、离散程度的测度 定类数据:异众比率 定序数据:四分位差 定距和定比数据:方差及标准差 异众比率 1. 离散程度的测度值之一 2. 非众数组的频数占总频数的比率 3. 仅用于定类数据 4. 用于衡量众数的代表性 四分位差 1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 方差和标准差(Variance and Std。deviation) 1. 离散程度的测度值之一 2. 最常用的测度值 3. 反映了数据的分布 4.反映了各变量值与均值的平均差异 5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 偏态 (kurtosis) 1. 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 峰度(skewness) 1. 数据分布扁平程度的测度 2. 峰度系数=3扁平程度适中 3. 偏态系数3为扁平分布 4. 偏态系数3为尖峰分布 三、描述统计量的软件实现 1、Excel 选择工具==数据分析==描述统计 即可输出大部分描述统计量。 但EXCEL只能按行或列进行分组统计,因此在编辑数据时要注意。 2、SPSS SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Analyze→Descriptive Statistics菜单中,最常用的是列在最前面的四个过程: Frequencies过程的特色是产生频数表; Descriptives过程则进行一般性的统计描述; Explore过程用于对数据概况不清时的探索性分析; Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验; 我们常用的X2 检验也在其中完成。 Frequencies过程 此过程可以方便地对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。频数分布表是描述性统计中最常用的方法之一。它还可对数据的分布趋势进行初步分析。 【Statistics 按钮】 Percentile Values复选框组 定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for?? equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5; Central tendency 复选框组 用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum) ; Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、均值标准误差(S.E.mean) ; Distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis) ; Values are

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档