- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用统计学-03
应用统计学-3 例3.1 例3.(排序) 例3.2(例2.3) 例3.3 例3.4 箱图的制作 时间序列线图的制作 例3.6 雷达图的制作 例3.7 统计数据是谎言! 我一眼就看出来了, 大多数日加工零件 数在120-125之间 实例 下表是某电脑公司2005年4个月每天的销售数据,试对数据进行分组。 接收区域 频率=频数/总和 频数 什么是左偏? 什么是右偏? 单科最高、最低 平均最高、最低 集中、离散程度 定义3.6 将各有序类别或组的频数逐级累加起来得到的频数,称累积频数。 定义3.7 将各有序类别或组的百分比逐级累加起来,称为累积频率或累积百分比。 定义3.8 根据统计研究的需要,将原始数据按某种标准划分成不同的组别,称为数据分组。 定义3.9 分组后的数据称为分组数据。 定义3.10 把一个变量值作为一组,称为单变量值分组。 定义3.11 将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组。 定义3.12 在组距分组中,一个组的最小值,称为下限(low limit);一个组的最大值,称为上限(upper limit)。 定义3.13 一个组的上限值与下限值之差,称为组距。 定义3.14 在 组距分组时,如果各组的组距相等,称为等距分组。 定义3.15 在 组距分组时,如果各组的组距不相等,称为不等距分组。 定义3.16 每一组的下限和上限之间的中点值,称为中值。 最大值 最小值 最大值 例:以生产零件个数为变量。 以生产零件个数为变量,变量太多啦! 如何区分分类变 量和数值变量? 例:每五隔个零件为一个区间(变量)。 5≤K≤15 本组上限不在内 第一组下限低于最小变量,最后一组上限高于最大变量。 连续变量上限值可采用小数点的形式,如109.99 若最大、最小值与其他数据相差太大,为避免空白组或个别极端值漏掉,可用开口组 94 160 组距分组掩盖了各组内的数据分布状况。 注意: 不等距分组: (1)根据生理成长特点的人口年龄分组 0-6岁(幼儿组),7-17(少儿组),18-59岁(成年组),60岁以上(老年组) (2) 粒度划分 10mm 粒度划分 (真数与对数分组) 砾 (Pebble) 砂(sand) ~ 淤泥(silt) …… 64mm Cobble 2mm = ㏒2(直径) Pebble Sand Silt 频数密度:每一岁有多少人 幼儿组/少儿组/成年组/老年组 换成百分比(%) 组距为1个单位 宽度没有数值意义 长宽都有数值意义 定义3.17 直方图是用矩形的宽度和高度(即面积)来表示频数分布的图形 定义3.18 由“茎”和“叶”两部分组成的、反映原始数据分布的图形,称为茎叶图。 “?”表示0-4, “?”表示5-9。 105-109 110-114 106-107 108-109 定义3.1 落在某一特定类别(或组)中的数据个数,称为频数(frequency),也称次数。 定义3.2 把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布(frequency distribution)。 定义3.3 一个总体(或样本)中各个部分的数值的比重,称为比例(proportion)。 定义3.4 将比例乘以100得到的数值,称为百分比或百分数(percentage)。 定义3.5 总体或样本中各不同类别数值之间的比值,称为比率(ratio)。 注意:此处应该是频数 频率=频数/总和 频率? 频数? 例3.3 * 分类数据的逻辑检查 数值型的数据计算检查 中学学历的大学教师 排序的突然增加或较少 均值大于1/2总和 什么是口径? 统计数据的二重性 表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程成绩都高于70分的学生。 表3-1 筛选出统计学成绩等于75分的学生。 统计学成绩等于75分的学生。 筛选出英语成绩最高的前三名学生 英语成绩最高的前三名学生 筛选出4门课程都大于70分的学生 条件区 数据区 4门课程都大于70分的学生 按统计学成绩高低排序 按统计学成绩高低排序 广东沿海古海蚀平台的高度 2-3m 3m 2m 数据来源:谭惠忠等(1995) (黄海基面) (黄基) 1.6m
原创力文档


文档评论(0)