- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验描述性统计分析
实验四 描述性统计分析
一、集中趋势的测度
定类数据:众数
定序数据:中位数和分位数
定距和定比数据:均值
众数、中位数和均值的比较
一组数据向其中心值靠拢的倾向和程度
测度集中趋势就是寻找数据一般水平的代表值或中心值
不同类型的数据用不同的集中趋势测度值
低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据
选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定
众数(Mode)
集中趋势的测度值之一
出现次数最多的变量值
不受极端值的影响
可能没有众数或有几个众数
主要用于定类数据,也可用于定序数据和数值型数据
中位数(Median)
集中趋势的测度值之一
排序后处于中间位置上的值
不受极端值的影响
主要用于定序数据,也可用数值型数据,但不能用于定类数据
各变量值与中位数的离差绝对值之和最小,即
四分位数(Quartiles)
1. 集中趋势的测度值之一
2. 排序后处于25%和75%位置上的值
3. 不受极端值的影响
4. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据
均值(Mean)
1. 集中趋势的测度值之一
2. 最常用的测度值
3. 一组数据的均衡点所在
4. 易受极端值的影响
5. 用于数值型数据,不能用于定类数据和定序数据
众数、中位数和均值的关系
二、离散程度的测度
定类数据:异众比率
定序数据:四分位差
定距和定比数据:方差及标准差
异众比率
1. 离散程度的测度值之一
2. 非众数组的频数占总频数的比率
3. 仅用于定类数据
4. 用于衡量众数的代表性
四分位差
1. 离散程度的测度值之一
2. 也称为内距或四分间距
3. 上四分位数与下四分位数之差
QD = QU - QL
反映了中间50%数据的离散程度
不受极端值的影响
用于衡量中位数的代表性
方差和标准差(Variance and Std。deviation)
1. 离散程度的测度值之一
2. 最常用的测度值
3. 反映了数据的分布
4.反映了各变量值与均值的平均差异
5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差
偏态 (kurtosis)
1. 数据分布偏斜程度的测度
2. 偏态系数=0为对称分布
3. 偏态系数 0为右偏分布
4. 偏态系数 0为左偏分布
峰度(skewness)
1. 数据分布扁平程度的测度
2. 峰度系数=3扁平程度适中
3. 偏态系数3为扁平分布
4. 偏态系数3为尖峰分布
三、描述统计量的软件实现
1、Excel
选择工具==数据分析==描述统计
即可输出大部分描述统计量。
但EXCEL只能按行或列进行分组统计,因此在编辑数据时要注意。
2、SPSS
SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Analyze→Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:
Frequencies过程的特色是产生频数表;
Descriptives过程则进行一般性的统计描述;
Explore过程用于对数据概况不清时的探索性分析;
Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验;
我们常用的X2 检验也在其中完成。
Frequencies过程
此过程可以方便地对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。频数分布表是描述性统计中最常用的方法之一。它还可对数据的分布趋势进行初步分析。
【Statistics 按钮】
Percentile Values复选框组 定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for?? equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5;
Central tendency 复选框组 用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum) ;
Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、均值标准误差(S.E.mean) ;
Distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis) ;
Values are
您可能关注的文档
最近下载
- 教科版(2024)小学科学一年级上册(全册)教案及反思(含目录) .pdf VIP
- 2025年辽宁省初中学业水平考试(锦州市卷)中考英语试题含解析答案.pdf VIP
- 土建工程与基础 13次课第4章地基与基础第一节 土物理性质及工程分类.ppt VIP
- 科学技术是第一生产力创新思想.doc VIP
- JFE++Super-OLAC、HOP、E-WEL.ppt VIP
- 土建工程与基础课件 14次课 4.2 地基中的应力与变形.ppt VIP
- 第5课 美丽河山我们的家 课件 人民版中华民族大家庭.ppt
- 土建工程与基础课件 15次课 第4章 地基与基础 第3节 基础设计.ppt VIP
- 土建工程与基础课件10-1第3章3.6钢筋混凝土构件的裂缝和变形.ppt VIP
- 土建工程与基础课件10-23.7钢筋混凝土受压构件的计算.ppt VIP
文档评论(0)