- 1、本文档共102页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章:统计描述与统计推断
3.6、多维交叉表(Crosstabs) 为了解学生学习规划与其学习成绩、满意程度之间的关系,设计调查问卷并得到10个学生的调查数据: 1、您在大学期间是否做过规划: A 有 B 没有 2.您的家庭年收入是多少( )? 3、您对自己的学习状况是否满意? A 非常满意 B 一般 C 非常不满意 4、您对自己的能力培养状况是否满意? A 非常满意 B 一般 C 非常不满意 5、您对自己的生活充实度是否满意? A 非常满意 B 一般 C 非常不满意 调查结果 4.9 7.6 45 76 7.8 5.6 4.5 9 10 8 家庭年 收入(万元) A C B 10 C C B 9 B B C 8 C C C 7 C B B 没有 6 B A A 有 5 B B B 有 4 A A A 有 3 A A A 有 2 A B A 有 1 生活充实度 能力培养 满意度 学习 满意度 规划 状况 没有 没有 没有 没有 序号 问题的提出 分别分析规划情况,家庭年收入、学习满意度、能力培养满意度、生活充实度的分布情况 分别分析做过规划与没有做过规划同学在学习、能力培养与生活充实度三方面的分布情况如何? 分别分析不同家庭年收入同学在学习、能力培养与生活充实度三方面的分布情况如何? 分析思路 一、现状分析 1.规划情况、2.家庭年收入、3.学习满意度 4.能力培养满意度、5.生活充实度 二、有无规划对各方面满意度的影响 1.有无规划对学习满意度是否有影响 2.有无规划对能力培养满意度是否有影响 3.有无规划对生活充实度是否有影响 三、收入状况对各方面满意度是否有影响 1.收入差异对学习满意度是否有影响 2.收入差异对能力培养满意度是否有影响 3.收入差异对生活充实度是否有影响 四、结论与启示 多维交叉表(Crosstabs)过程 3.7、比率统计(Ratio) 箱形图(Boxplot) 箱形图由一个矩阵和向两侧延伸的细线组成。矩阵长度是四分位距。四分位距集合中,有50%的数据从左到右分布在这个矩形箱体内。(矩形箱体越短,数据的集中度越高)小25%的数据和较大的25%的数据在左右两侧。从这个图还可以看出样本数据值分布的偏度(Skewness)情况。如果右箱体和右胡须都短,则表明数据集聚在右侧,样本数据值的分布向左偏斜。反之就是向右偏斜。 当然,箱形图也可以竖立,两者的效果是相同的。 箱形图是综合表达数据中心特征和离散特征的图形方法。由于该图涉及到区间概念(基于差值的长度概念),所以箱形图仅适用于定比测度水平的数据。 箱形图的基本构造 极大值 上四分位点Q3=75% 中位数Q2=50% 下四分位点Q1=25% 极小值 极 差 四 分 位 距 =Q3-Q1 适合定比的 修正的箱形图 依据处于胡须(两端)的样本值离箱体边缘的距离,把这些处在胡须外的样本值分成若干类。 离箱体距离小于等于1.5倍的样本值,称为“本体值” 其余大于1.5倍的样本值,称为“外围值”。其中,又把处在胡须外离箱体距离大于1.5倍,但小于等于3倍的样本值,称为“奇异值”或“近外围值”或,用“○”表示;而处在胡须上离箱体距离大于3倍的样本值,称为“极端值”,用“*”表示。 身高数据的(修正)箱形图 某班级男生的身高数据(单位:厘米) 171???182 175 177 178 181 185 168 170 175 177 180?? 176 172 165 160 178 186 190 176 163 183 该班又转来一位新同学,其身高为226厘米。 散点图(Scatter ) 直方图(Histogram ) 条形图的弱点,例如身高问题 看不清楚数据的分布规律 如果我们对数据适当的分组,再用矩形的高度表示各组的个数或频率,就有可能看到数据的分布规律。 茎叶图(Stem-and-Leaf) 茎叶图适用于显示定比测度水平数据的频率结构。从某种意义上讲,就是把直方图横过来,是一种文本化的图形。 茎—叶的基本含义:按照某个一致的规则,把所有的样本值分成“茎节”和“叶”两个部分。“茎节”在左,“叶”在右。“茎节” “叶”用小数点隔开。 “茎节”的宽度,是指“茎节”的末位数上的数字1,所代表的实际数为(10或k,k是整数) “茎节”确定后,“叶”便随之确定。例如,规定“茎节”的宽度是100,则十位数和其后的位数都是“叶”。样本数123,“茎节” “叶”
文档评论(0)