数据分析课件1剖析.ppt

数据分析课件1剖析

数据分析 第一章 数据描述性分析 1. 数据的数字特征 数据分析研究的对象是数据, 一元数据是 个观测值 要研究数据的数字特征,分析数据的集中位置、分散程度、 数据的分布是正态还是偏态。 对于多元数据,要分析数据各个分量的相关性等等 . 1.1.1 均值、方差等数字特征 1.均值 2.方差 标准差 变异系数 1.1.1 中位数、分位数、三均值与极差 其他异常值的发现方法 在处理统计问题时,往往首先假设样本来自某个总体,然后在此基础上进行统计推断。可能发生以下这样的情况:在得到了一组观察值后,发现其中的一个或几个观察值和其他观察值之间在数量上有较大的差异,不像是从同一个总体得到的。例如:天文学家肖维勒于1863年处理的关于金星垂直半径的15个观察数据的残差数据: -1.40,-0.44,-0.30,-0.24,-0.22,-0.13, -0.05,0.06,0.10,0.18,0.20,0.39,0.48,0.63,1.01, 其中-1.40和1.01与其他观察值之间的差异较大。 样本中的个别观察值,其数值明显地偏离子样中其余的观察值,这些个别观察值可能来自不同的总体,我们称之为异常值(或离群值)。 就前例,天文学家肖维勒于1863年处理的关于金星垂直半径的15个观察数据的残差数据: -1.40,-0.44,-0.30,-0.24,-0.22,-0.13, -0.05,0.06,0.10,0.18,0.20,0.39,0.48,0.63,1.01。 2. 数据的分布 数据处理 数据处理 1.2.2 茎叶图、箱线图及五数总括 茎叶图 例1.11 某班有31个学生,某门课程考试成绩如下: 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 作出茎叶图. 解 第一个数25十位数为2,个位数为5.以个位数为单位, 将25用“|”分开:25 → 2 | 5. 这样,得茎叶图. 频数 2 |5 1 3 | 4 |5 1 5 |0 4 5 3 6 |1 4 8 3 7 |2 5 5 8 9 5 8 |1 3 4 4 4 5 6 6 6 7 9 9 9 13 9 |0 1 1 2 4 10|0

文档评论(0)

1亿VIP精品文档

相关文档