- 1、本文档共61页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
定类变量、定序变量、定距变量,定比变量: 定类变量:是指变量的取值即变量值只有类别属性之分,而没有大小、优劣之别。 定序变量:是指变量的取值,即变量值,除了有类别属性之分外,还有等级或次序的区别。 定距变量:是指变量的取值即变量值,除了具有类别、次序区别之外,还有类别之间、序列之间的标准化距离的变量。 定比变量:是指变量的取值,即变量值除具有定类、定序、定距等特征外,在变量取值中还有一个真正的零的变量即为定比变量。 * 用Pearsons卡方统计量进行统计检验时应注意的问题: 列联表的卡方检验用于检验两个分类变量的关联程度。卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma检验比用卡方检验更好。 * trimmed mean:截尾均值 * 四、探索性分析 通过茎叶图(Stem-and-Leaf Plots)描述频度分布 茎叶图由数字构成,表达变量的频数分布。 在茎叶图中: 第1列表示频数,表示个案的个数 第2列表示茎叶图的茎,表达整数部分,其代表的数值与茎宽(Stem width)有关 当Stem=6,Stem width=10,实际表达的值是60 第3列表示茎叶图的叶子,表达小数部分,其代表的数值也与茎宽有关, Each leaf表示每片叶子的个案数 茎叶图中第1行数据表示的意义 表示有2个小于或等于55的极端值(Extreme) 茎叶图中第4行数据表示的意义 共有8个个案 值为75、76、77的个案各有1个 值为78的个案有2个 值为79的个案有3个 茎叶图中最后1行数据表示的意义 表示有2个大于或等于94的极端值(Extreme) 第1列 第2列 第3列 四、探索性分析 通过茎叶图(Stem-and-Leaf Plots)描述频度分布 例五:语文成绩茎叶图 数据文件:3-StudentScore.sav Analyze →Descriptive Statistics →Explore… (结果保存为:3-StudentScore_Stem-Leaf.spo) 选择输出统计表格和图形 1 2 3 通过箱图(Boxplots)描述数据分布 箱图也称为箱线图(箱式图),显示了变量数据的中位数、25%百分位数和75%百分位数,并给出偏离总体分布的奇异个案和极端个案。 四、探索性分析 箱图主体 箱图本体 中位数 通过箱图(Boxplots)描述数据分布 奇异值: 某个数据距离箱体主体边缘的距离超过箱主体高度的1.5倍,称为奇异值,在箱图中用○表示。奇异值分为上奇异值和下奇异值。 极端值: 某个数据距离箱体主体边缘的距离超过箱主体高度的3倍,称为极端值,在箱图中用★表示。极端值分为上极端值和下极端值。 四、探索性分析 通过箱图(Boxplots)描述数据分布 四、探索性分析 通过箱图(Boxplots)描述数据分布 语文成绩箱图 四、探索性分析 排序后 通过箱图(Boxplots)描述数据分布 例六:语文成绩箱图(数据文件:3-StudentScore.sav) (结果保存为:3-StudentScore_Box.spo) 四、探索性分析 1 2 3 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性(有两种) (1)正态概率图以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数为纵坐标。斜线为正态分布的Z分数的期望标准线,若观测点离线越近,表示点越符合正态分布。反之,越不符合正态分布。 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性 (2)反趋势正态概率图也是以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数与正态分布期望值的偏差为纵坐标。水平直线为期望标准线,若观测点离线越近,表示该点越符合正态分布。反之,越不符合正态分布。 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性 例七:语文成绩正态分布检验的Q-Q概率图 (数据文件:3-StudentScore.sav) Analyze →Descriptive Statistics→Explore… (结果保存为:3-StudentScore_Q-Q.spo) 1 2 3 四、探索性分析
您可能关注的文档
- 中外联合发行邮票纪念封欣赏.ppt
- 中天三建-工具化、定型化、标准化产品的推广和应用.ppt
- 中央人民广播电台音乐之声太原FM89.3.ppt
- 中央空调及其他设备系统的运行维护及节能监控.ppt
- 中学化学教学中学生科学本质观的培养.ppt
- 第21章光的干涉.ppt
- 第20课新民主主义革命与中国共产党[课件9].ppt
- 中学生不可交坏朋友主题班会.ppt
- 第23课思想与文学艺术.ppt
- 第22课电和磁复习(原创by明珠学校).ppt
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)