数据分析方法第一章摘要.ppt

第一章 概述 第一章 数据描述性分析 数据的描述性分析即从数据出发概括数据特征,主要包括数据的位置特性、分散性、关联性等数字特征和反映数据整体结构的分布特征,它是数据分析的第一步,也进一步分析的基础。 1.1.1 表示位置的数字特征 1.1.2 表示分散性的数字特征 1.1.3 表示分布形状的数字特征 1.1.1 表示位置的数字特征(统计量) 如果要用简单的数字来概括一组观测数据x1,...,xn,可以使用“位置统计量”来作为数据的总体代表,常见的位置统计量有:均值、中位数、分位数、众数等。 1. 均值(Mean):是所有观测值的平均值,是描述数据取值中心位置的一个度量: 设x1,...,xn是n个观测值,它们的次序统计量为x(1), x(2),…, x(n),即 x(1)≤ x(2)≤…≤x(n) x(1)为最小次序统计量, x(n)为最大次序统计量, 2. 中位数(Median或Med)表示一组数据按照大小的顺序排列时中间位置的数值 中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点具有稳健性。计算方法是:首先将数据从小到大排序为:x(1),...,x(n),然后计算 3. 分位数(Percentile)根据变量值由小到大的顺序排列分割成若干

文档评论(0)

1亿VIP精品文档

相关文档