- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 统计数据的描述 ;第一节 统计数据的整理
第二节 分布集中趋势的测度
第三节 分布离散程度的测度
第四节 分布偏态与峰度的测度
第五节 统计表和统计图;学习目标;录取中有无歧视?;两个系的报考及录取情况;2.1 统计数据的整理;统计整理;制定统计整理方案;数据的审核;数据的排序(data rank);世界人均国民总收入;2.1.1 统计数据的分组;统计分组的基本原则:
必须保证在某一标志上,组内的同质性和组间的差异性。
分组兼有“分和合”双重含义 ;;统计分组的关键:
1、选择分组标志 :
品质标志(性别、质量等)
数量标志(数量、数值等)
2、划分各组界限; 学生按性别分组;某班学生按考试成绩分组;按数量标志分组;2.1.2 次数分配; 次数分配是将总体按一定的标志分组,说明个体在各组之间的分布情况。是统计资料整理结果的一种重要表现。;分组方法;单变量值分组(要点);例题分析;单变量值分组表(实例);组距分组(要点);工人按月工资额分组(元);不等距分组
各组的组距是不相等
各组频数的分布受组距大小不同的影响;等距分组步骤; 2) 确定各组的组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即
组距=(最大值 - 最小值)÷组数
例2.1的数据,最大值为128,最小值为84,则
组距=(128 - 84)/6=7.3。
组距宜取5或10的倍数;(近似值)
在实践中,组数和组距要通过反复的实验确定,最终确定出最有意义的组数和组距的组合。;3)确定组限:组限是分组的数量界限,是表明每组界限的两头数值。
下 限(low limit) :一个组的最小值
上 限(upper limit) :一个组的最大值
组限的具体形式有:重合组限和间断组限;闭口组限和开口组限。
确定组限的原则1:最小一组的下限必须包含数列中最小变量值;最大组的上限必须包含数列中最大变量值。
确定组限的原则2:遵循不重不漏的原则。
★“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;
★“不漏”在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
;4)根据分组计算频数,整理成频数分布表:将原始数据按照各自的大小分配到各组中。; 对于重合组限的形式,为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于其一组上限的变量值不算在本组内,而计算在下一组内。
重合组限既适用于连续型变量分组也适用于离散型变量分组,应用非常广泛。;对于离散变量,可以采用相邻两组组限间断的办法(间断组限)解决“不重”的问题。;如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采取“x x以下”及“x x以上”这样的开口组。
开口组通常以相邻组的组距作为其组距。
例如,在例2—1的30个数据中,假定将最小值改为64,最大值改为160,采用上面的分组就会出现“空白组”,这时可采用“开口组”,如80以下;130以上。;按周加工零件数分组;编制频数分布表的步骤; 在研究分析次数分布时,还需要计算:累计频数和累计频率;表 某车间工人周零件数的频数分布表; 在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的代表值。
组中值(class midpoint) :下限与上限之间的中点值。;例:组中值计算;在开口组中,组中值的计算以邻近组组距为依据;例:组中值计算;次数分配表的编制(例题分析);使用Excel频数函数 (FREQUENCY);次数分配表;2.1.3 次数分配直方图;1. 直方图;分组数据的图示(直方图的绘制);2.折线图;分组数据的图示(折线图的绘制);3.次数分布曲线;频数分布曲线的类型;2.1.4 洛伦兹曲线与基尼系数;洛伦茨曲线(累积次数分配折线图);基尼系数 ;2.2 分布集中趋势的测度 ;数据集中区;一、众数
二、中位数
三、四分位数
四、均值
五、几何均值
六、切尾均值
七、众数、中位数和均值的比较;1.概念:在总体中出现次数最多的那个标志值就是众数。;;M0;下三图无众数:;1)定类数据的众数 ;2)定序数据的众数;① 根据单项数列
您可能关注的文档
最近下载
- 实验一、蛋白质的等电点测定和沉淀反应.ppt VIP
- 化工泵培训课件.pptx VIP
- 安全生产管理机构设置及人员配备管理制度范本.pdf VIP
- 消防专用电话课件.pptx VIP
- 实验一 蛋白质的等电点测定和沉淀反应.ppt VIP
- NB-T 20133.6-2012 压水堆核电厂设施设备防护涂层规范 第6部分涂装作业.pdf VIP
- 趣味性游戏在音乐教学中的应用策略-来源:中国校外教育(第2019009期)-中国儿童中心.pdf VIP
- 2025年职业资格公路水运检测师道路工程-道路工程参考题库含答案解析(5套).docx VIP
- 《多元统计学》第8章 判别分析.ppt VIP
- 钢结构楼梯工程施工方案(3篇).docx
文档评论(0)