- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五讲 基本统计分析
教学目的:掌握Reports、Descriptive Statistics的统计原理与基本运用;掌握基本统计分析的实际问题解决;运用基本分析形成对某组数据的综合解释。
教学重点:Crosstabs过程;
教学难点:Crosstabs过程;
具体教学内容:
一、常用统计量介绍
1.平均数(average)
(1)Mean:算术平均数。最常见的集中趋势量,多用于对对称分布尤其是正态分布数据集的描述,不适用于偏态分布的数据集。
(2)Harmonic Mean:调和平均数。在样本容量不等的情况下估计平均样本容量时是比较有用的。其等于样本个数除以各样本容量倒数之和。
(3)Geometric Mean:几何平均数。在描述呈倍数关系的等比数据或对数正态分布的数据时比较有用。其等于n个数据乘积的n次方根。在应用中要注意数据不能同时有正有负。
(4)median:中位数
中位数是数据的位置平均数,用于描述偏态分布资料的集中位置。它不受两端特大、特小值的影响,并且当分布两端无确切数据时也可计算出来。
(5)Mode:众数
(6)Std. Error of Mean:均值标准误。由于抽样等原因,使得样本数据不一定能准确反映总体。均值的标准误就是用来度量样本平均数与总体平均数之间的平均差异程度的统计量。
一般来讲,若某一均值与理论均值的差值除以标准误得数的绝对值大于2,则基本上认为该均值是不可接受的。
2.Kurtosis(峰度系数)、Std. Error of Kurtosis(峰度标准误)
峰度系数用来度量数据在中心聚集程度。在正态分布情况下,峰度系数值是0。正的峰度系数说明观察量更集中,有比正态分布更长的尾部;负的峰度系数说明观测量不那么集中,有比正态分布更短的尾部,类似于矩形的均匀分布。
峰度系数的标准误用来判断分布的正态性。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。
3.Skewness(偏度系数)、Std. Error of Skewness(偏度标准误)
偏度系数用来度量分布是否对称。正态分布左右是对称的,偏度系数为0。较大的正值表明该分布具有右侧较长尾部。较大的负值表明有左侧较长尾部。偏度系数与其标准误的比值同样可以用来检验正态性。如果其比值绝对值大于2,可以认为拒绝了正态性。
4.百分位数(percentile)
百分位数是资料分布数列的百等份值,用于描述样本或总体观测值序列某百分位置的水平。四分位数(quartile)是特定的百分位数。
5.极差(range)
又称全距,即最大值和最小值的差。它受极值的影响大,不十分稳定。
? 6.四分位数间距(IQR)
?? 四分位数中,P25为下四分位数Ql,P75为上四分位数Qu。四分位数间距即Qu-Ql。四分位数间距比极差稳定,但仍未考虑每个数据的变异程度。
7.方差(variance)、标准差(Std. Deviation)
方差与标准差能反映整个资料的变异程度。标准差用于描述变量值的离散程度,可以反映数据分布情况,计算参考值范围。
二、Reports过程
1、OLAP Cubes:联线式分析处理块
功能:同组变量内各变量统计量小结;
命令:Analyze-Reports-OLAP Cubes;
2、Case Summaries:观测量列表
功能:了解数据结构;检查数据;阶段列表观察;
命令:Analyze-Reports-Case Summarize;
3、Report Summaries in Rows(Columns)行(列)形式报表
功能:不同格式的报表;
命令:Analyze-Reports-Report Summaries in Rows(Columns)
三、Descriptive Statistics过程
1、Frequencies:单变量频数分析
功能:变量值频数;简单分布;
命令:Analyze-Descriptive Statistics-Frequencies
2、Descriptive:描述分析
功能:变量的描述统计量;
命令:Analyze-Descriptive Statistics-Descriptives
3、Explore:探索分析
功能:指定变量的综合描述统计量;整体分析、分组分析;箱形图、直方图、正态检验等方法;
命令:Analyze-Descriptive Statistics-Explore
四、Crosstab:交叉表分析
Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kappa值等。
Crosstabs过程不能产生一维频数表(单变量频数表),该
您可能关注的文档
最近下载
- 2025-2026人教部编版三年级上册语文教学计划.docx VIP
- 施工现场车辆安全教育.pptx VIP
- 给排水系统学习培训ppt课件.pptx VIP
- 2025北京市十八里店乡人民政府城市协管员招聘21人笔试参考题库附答案解析.docx VIP
- 输血科管理制度、程序性文件、SOP文件.docx VIP
- 05J909_工程做法_建筑专业图集.docx VIP
- 2021海绵城市设施通用图集.docx VIP
- 【统编版】高中语文必修上册第一单元《3百合花》优质课(29张PPT)课件.pptx VIP
- 钢丝帘线压延机生产线(中文参考).doc VIP
- 2025年福建省福州市辅警协警笔试笔试预测试题(含答案).docx VIP
文档评论(0)