基本统计分析基本统计分析概述一、基本统计分析包括的内.pptVIP

基本统计分析基本统计分析概述一、基本统计分析包括的内.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基本统计分析 基本统计分析概述 一、基本统计分析包括的内容 ①频度分析Frequencies ②统计描述Descriptives ③考察分析Explore ④多维频数分布交叉列联表Crosstabs ⑤摘要报告表OLAP Cubes和Case Summaries ⑥行形式的输出报告Report Summaries in Row ⑦列形式的输出报告Report Summaries in Column 二、统计分析的特殊图形 箱图Boxplot 茎叶图Stem-and Leaf Plot 单变量的统计描述 一、频度分布: 某变量取值的各种情况或各种取值出现的次数或频数。 二、集中趋势的量度 集中趋势的量度反映变量所有观测值的某种共同性质。这些性质是由绝大多数观测值决定的。 ①平均值:Mean ②中位数:Median 表示位于数据数列中心位置的那一项的大小。 奇个数:第(n+1)/2个数的值 偶个数:第n/2与第(n/2)+1两个数的均值 ③众数:Mode 数据中重复出现次数最多的数值。系统只计算最小的数值。 平均值、中位数和众数的应用特征: ⒈考试后,对两个班级的考试成绩的对照分析用什么描述统计数据? ⒉对全体学生做教学满意度(n等级)调查,最中性的评价态度的描述用什么描述统计数据? ⒊其中学生最集中的评价用什么描述统计数据? 三、离心趋势的度量 描述数据个性方面的特征,即数据的分散程度或差异程度。 ①跨度(全距)(range):观测值中最大值与最小值之差。 跨度表现了总体观测值分布的最大范围,跨度大,表现分布范围大。 ②方差(Variance): 每个数据与该组数据平均数之差乘方后的均值 ③标准差(Standard deviation): 方差的平方根。 方差、标准差值越大,说明分布偏离中心的程度越大;其值小说明数据相对比较集中。 ④偏(斜)度(Skewness):描述分布偏离正态分布的程度,即偏离对称的程度。 Skewness Skewness0: 正偏离 Skewness0: 负偏离 ⑤峰(峭)度(Kurtosis): 描述单峰频度曲线峰形的尖平程度。 Kurtosis Kurtosis0 分布集中趋势强 Kurtosis0 分布离心趋势强 ⑥差异系数: CV=(S/M)% S:标准差 M:平均值 ⑦标准分数:Z分数 以标准误为单位表示一个分数在群体中所处的相对位置。 ⑧百分位数和N等分百分位数(percetile Ntile): 百分位数和N等分百分位数能够度量全部观测值对中心位置的平均偏差,从而对数据的离散性做出最综合的说明。 百分位数的数值是给出对应不同百分比的数值,例如:50%对应85,表明50%的个案取值在85及其以下。 N等分百分位数是将总体个案数等份成N等份,产生的N-1个百分比对应N-1个数值,分别表示不同比例的个案取值在给定数值及其以下。 特殊统计图形 一、箱图(Boxplots图) 箱图或称箱线图,可以直观地描述变量频度分布特征。 箱图Box主体: 由大于25%的百分位数到小于75%的百分位数的个案组成。中间的黑色横线表示中位数。 箱图Box本体: 由上触须线和下触须线包括的范围组成。其意义是除去奇异值和极端值后的全部个案观测值。 奇异值: 数据点到主体边缘的距离超过箱高的1.5倍。 上奇异值=(75%百分位数-25%百分位数)*1.5+75%百分位数 下奇异值=25%百分位数-(75%百分位数-25%百分位数)*1.5 极端值: 数据点到主体边缘的距离超过箱高的3倍。 上极端值=(75%百分位数-25%百分位数)*3+75%百分位数 下极端值=25%百分位数-(75%百分位数-25%百分位数)*3 二、茎叶图Stem-and-Leaf Plot 在输出显示窗口Viewer中以字符数字构成的图,用以表达变量的频度分布。例如: Frequency Stem Leaf .00 6 . 1.00 6 . 2 1.00 6 . 5 3.00 6 . 667 3.00 6 . 889 7.00 7 . 0001111 7.00 7 . 2223333 9.00 7 . 444455555 8.00 7 . 12.00 7 . 88888999999

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档