- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 统计数据的收集与整理;教学目的
了解数据的计量尺度
了解数据的类型
重点和难点
正确理解计量尺度之间的区别
;1、定类尺度 (Nominal Scale);2、定序尺度(Ordinal Scale);3、定距尺度 Interval Scale;4、定比尺度 Ratio Scale;定距尺度与定比尺度的区别;定类尺度;四种计量尺度的比较;四种计量尺度的比较;数据的计量尺度;重点和难点:
统计表的设计,常用统计图的绘制方法 ;一、统计表
统计资料最常用的表达形式,将统计工作过程中所取得的各种数字资料,经过汇总整理后,按一定的项目和顺序填写在一定的表格内,这种表格称为统计表。
;(一)统计表的结构形式;(二)统计表的种类;分组表举例;复合表举例;(三)编制统计表的基本原则;4、对于栏数较多的统计表,通常加以编号。主词栏用甲、乙等文字标明;宾词栏用(1)、 (2)、 (3)等标明。
5、表中数字上下位置要对齐,??小数点时应以小数点对齐,而且小数点的位数应统一。遇有相同数字应照写,不能写“同上”。无数字的空格,用符号“--”表示;缺数字时,用符号“… …”。表中还应列出合计栏。
6、统计表的格式一般是开口式,即表的左右两端不画纵线,上下用粗线封口。
7、必要时,统计表要加注解。;数据类型;1、条形图(Bar Chart);2、圆形图 (Pie Chart);3、直方图(Histogram);;直方图与条形图的异同;4、折线图 (Frequency polygon);审计时间的折线图;
主要用于显示未分组的原始数据的分布。“茎”和“叶”两部分构成,其图形是由数字组成的。
通常以数据的高位数值作树茎,低位数字作树叶,树叶上只保留一位数字。
树叶的竖列要对齐,以计算各组的次数。
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
从小到大排序后的数据:
茎叶图:;40名教师的年龄的数据:40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64 ;6、箱形图;不同箱形图对应不同数据分布特征;例:2012年度某高校经济管理学科共有10篇博士学位论文需要评审,分别请该领域8位专家进行审稿,论文得分数据如下表所示。;利用SPSS软件中的“graph”功能可绘制出各博士学位论文得分情况的箱形图;7、线图(Line Chart) ;绘制统计图时的注意事项;2、图形要尽量简明。图形应该突出所要传达的信息,不必要的标签、背景、网格线、等会分散读者的注意力。
3、图形应该有清楚的标题和必要的说明,明确图形的含义、计量单位、坐标轴代表的变量、资料来源等等。
4、反复加工和修改是获得优秀统计图形的重要步骤。统计软件给出的统计图形没有多少可以不加修改而直接应用。;思考题:
1、统计表由哪几个主要部分组成?
2、制作统计表应注意哪几个问题?
3、各种常用统计图各有什么特点?
4、绘制统计图时应注意哪几个问题?
;5、某百货公司连续40天的商品销售额如下(单位:万元)
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。;39;40;重点和难点
掌握数据集中趋势和离散程度的测度方法
掌握分布偏态与峰度的测度方法
;数据描述的数值方法;一、 集中趋势;1、众 数;②分组资料:在组距式分组的情况下,频数最多的组是众数组,在该组内确定众数。;某单位80工人一周生产零件数分组统计资料如下:;2、中位数;③如果是组距式分组资料,公式为:;;3、四分位数;四分位数计算(例子);4、平均数(均值);简单平均数(例子);加权平均数(例子);关于计算结果的说明;几何平均数;例:三个车间连续生产某种产品,合格率分别为80%、90%、70%,则平均合格率为?;众数、中位数和算术平均数的关系;小结:众数、中位数、平均数的特点;平均数 (均值):
一组数只有一个均值
易受极端值影响(使用了全部数据)
各变量值与均值的离差之和等于零
数学性质优良,主要用于数值型数据
数据对称分布或接近对称分布时应用
;二、离散程度;1、全距(极差);等于上四分位数与下四分位数之差,用Qd表示。
反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。
不受极端值的影响。
可以用于衡量中位数的代表性。 ;方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差的平方根。
总体方差和样本方差的符号不同,计算公式也不一样。
是反映定量数据离散程度的最常用的指标。
;方差的计算公式;标准差(例子);4、离散系数;离散系数:例子;偏态
文档评论(0)