- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 2章 描述性统计:表格与图形
本章要点:
单变量数据的汇总
分类变量,数值型变量
双变量数据的整理与显示
分类变量+数值型变量
涉及概念:
频数分布表、条形图、直方图、茎叶图、点图、列联表等。
July 30, 2010
男学生更容易逃课吗?
读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下
July 30, 2010
男学生更容易逃课吗?
逃课情况
男
女
合计
几乎一次不逃
28
49
77
1到3次
24
31
55
3到5次
6
4
10
5次以上
3
3
6
其他
1
2
3
合计
62
89
151
你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择使用呢?
数据的整理与显示(基本问题)
要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的
对分类数据主要是做分类整理
3. 对数值型数据则主要是做分组整理
一、单个分类数据的汇总(基本过程)
1. 列出各类别
3. 制作频数分布表
4. 用图形显示数据
分类
频数
相对频数
百分比频数
A
B
C
D
E
相对频数分布和百分比频数分布
分类数据的汇总例
如:由以下40个人的血型资料
O O A B A O A A A O
B O B O O A O O A A
A A AB A B A A O O A
O O A A A O A O O AB
整理可得频数分布表如右
血型
频数
相对频数
百分比频数(%)
A
18
0.45
45
AB
2
0.05
5
B
4
0.1
10
O
16
0.4
40
合计
40
1
100
【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的类型进行了记录,如果一个顾客购买某一种类的饮料,就将这一饮料的种类名字记录一次 。右边就是记录的原始数据
分类数据的汇总
碳酸饮料
碳酸饮料
其他
矿泉水
绿茶
绿茶
绿茶
碳酸饮料
其他
碳酸饮料
矿泉水
其他
其他
碳酸饮料
矿泉水
矿泉水
碳酸饮料
果汁
绿茶
其他
碳酸饮料
绿茶
绿茶
碳酸饮料
碳酸饮料
矿泉水
绿茶
果汁
其他
果汁
碳酸饮料
碳酸饮料
碳酸饮料
矿泉水
矿泉水
绿茶
碳酸饮料
果汁
绿茶
绿茶
果汁
绿茶
矿泉水
其他
其他
碳酸饮料
矿泉水
碳酸饮料
果汁
矿泉水
分类数据的图示—条形图与饼图
条形图(bar chart):在横轴上标记组名,纵轴标记频数、相对频数或百分比频数,以相同宽度的长方形代表每一类别。对于分类数据,为强调每组是彼此相互独立的类别,应该将这些长方形分隔开
频数分布表
定义
饼图(pie chart):先画一个圆圈表
示所有数据,根据相对频数将整个圆
分成若干个扇形,这些扇形角度与每
一组的相对频数一致。
分类数据的图示—条形图与饼图
每个扇区可以是频数、相对频数或
百分比频数
饮料类别购买记录结构图
课后作业1
请对P46练习22数据用Excel完成:
a)构建频数分布表
b)画出条形图
c)画出饼图
统计图表
11
步骤
确定互不相叠的分组的组数
确定每组的组距
确定每一组的界限
二、单个数值型数据的汇总
表2-4 年终审计所需时间(天)
3. 确定组限
选择合理的分组界限以保证每个观测值仅属于唯一的组
针对数值型数据,分类数据无需指定组限
对于表2-4,第一组以10作为该组下限,14作为该组上限,10~14代表这一组。以此类推确定所有分组
统计落入每组的数据频数,得频数
分布表2-5所示:
4. 组中值
组中值(class midpoint):在每个组的下限和上限之间的中间值。在表2-4数据中,5
您可能关注的文档
- 第2章控制工程控制系统的数学描述-V1.2综述.ppt
- 第5章搜索求解策略(AI应用3版)综述.ppt
- 道路运输企业车辆技术管理规范综述.ppt
- 道路筑养施工组织设计综述.docx
- 第5章搜索求解策略综述.ppt
- 第2章类和对象的基本概念综述.ppt
- 第5章调查问卷设计综述.ppt
- 无形资产评估分解.ppt
- 第5章统制账户练习题综述.doc
- 无压力传送分解.docx
- 森林群落发育及演替.ppt
- 2025届江苏省苏州市工业园区中考一模数学卷(含解析).pdf
- 高中历史选择题考试技术(四)考试技巧之逻辑判断 用“全面”的观点 高考历史做题方法指导.pptx
- 10,2酸和碱的中和反应课件--九年级化学人教版下册.pptx
- 2025届江苏省泰州市兴化市中考一模数学试卷(附解析).docx
- 2025届江苏省扬州市中考一模数学试卷.docx
- 2025届江苏省泰州市靖江市中考一模数学试卷(附解析).docx
- 9.3 力与运动的关系 -八年级物理下册课件(苏科版).pptx
- 2025届江苏省中考数学一模试卷(附解析).docx
- 2025年江苏省常熟市中考第一次适应性考试数学试卷(附解析).docx
文档评论(0)