《商务数据分析》 课件 4-3描述性统计分析.pptx

《商务数据分析》 课件 4-3描述性统计分析.pptx

BusinessDataAnalysis商务数据分析

描述性统计分析

描述性统计分析描述性统计法是运用描述性统计指标对数据集进行研究。在获得数据集后,利用描述性分析可以初步了解数据的基础特性,它属于初级的数据分析。

在对数据分析时,一般首先要对数据进行描述性统计分析,分析对象数据的集中程度、离散程度等信息,以发现其内在的规律,为进行下一步数据分析提供有效的推断依据。描述性统计分析

描述性统计量主要分类描述变量集中趋势的统计量描述变量离散程度的统计量描述变量分布情况的统计量描述性统计分析

描述性统计分析平均值(Mean)Excel描述性统计分析工具提供的是算数平均值中位数(Median)指将各变量值按大小排序后,处于序列中间位置的那个变量值众数(Mode)指一组数据中出现频率最高的数据值和(Sum)和指某变量的所有变量值之和描述变量集中趋势的统计量数据的集中趋势分析用来反映数据的一般水平。常用的指标有平均值、中位数、众数、和等。

描述性统计分析描述变量集中趋势的统计量数据的离散程度分析主要是用来反映数据之间的差异程度,离散程度越大,说明集中程度越差,平均数的代表性越弱。描述变量离散程度的统计量有标准差、方差、最大值、最小值、极差等。

描述性统计分析标准差描述变量关于均值的偏离程度标准差(Std.deviation)方差指标准差的平方,是各个观测值与其均值离差平方的均值方差(Variance)指某变量所有取值的最大值最大值(Maximum)是反映抽样误差大小的统计指标,是统计推算的可靠性指标均值标准误差(S.E.mean)指某变量所有取值的最小值最小值(Minimum)是某变量极大值与极小值之差,结合MAX公式和MIN公式就可要计算数据中的极差极差(Range)

在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0,而峰度也接近于0,就可以判断总体的分布接近于正态分布。描述性统计分析描述变量分布情况的统计量

描述性统计分析描述变量分布情况的统计量图1偏度(Skewness)图2峰度(Kurtosis)

谢谢观看主讲人:朱景伟义乌工商职业技术学院

文档评论(0)

1亿VIP精品文档

相关文档