- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲描述分析
第二讲 数据的描述统计 集中趋势(central tendency) 算术平均数 中位数 众数 几何平均数 算术平均数arithmetic mean(1) 简单算术平均数 Simple arithmetic mean 算术平均数arithmetic mean(2) 加权算术平均数 Weighted arithmetic mean 中位数 median(1) 中位数 median(2) 中位数 median(3) 其中, Me:中位数; Sm-1:到中位数组前面一组为止的向上累计频数; Sm+1:到中位数组后面一组为止的向下累计频数; fm为中位数组的频数; i为中位数组的组距。 例题:分组数据的中位数 众数mode(1) 众数mode(2) 其中: L:众数所在组的下限; U:众数所在组的上限; i:众数所在组的组距; fm:众数组的频数; fm-1:众数组前一组的频数; fm+1:众数组后一组的频数。 几何平均数geometric mean(1) 社会经济现象的同质总体在时间上变动速度的平均数。 动态平均数 平均发展速度是总速度的平均,但平均发展速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积, 几何平均数geometric mean(2) 简单几何平均数 几何平均数geometric mean(3) 加权几何平均数 例题(1) 1950年我国总人口为5.5亿,1985年达到了10.5亿,共计增长了1.9倍。 (1)测算1950-1985年,我国平均每5年的人口增长速度; (2)测算1950-1975年,我国平均每5年的人口增长速度; (3)如果1975-1985年期间不实行计划生育政策,请测算1985年我国的人口总数。 例题(2) 例题(3) (1)MG=(1.114?1.077?1.096?1.144?1.114?1.068?1.089)1/7=1.100026,即 1950-1985年,我国平均每5年的人口增长速度为10.00% ; (2)MG=(1.114?1.077?1.096?1.144?1.114)1/5=1.10366, 即1950-1975年,我国平均每5年的人口增长速度10. 36%; (3)P=92420 ?(1.10366)2 = 112574(万人),即1985年我国的人口总数达到11.26亿。 离散趋势的度量 极差 四分位差 方差和标准差 变差系数 极差(全距)range 最大标志值与最小标志值之差 四分位差 将一组数据按大小排列成序,然后将其四等分,去掉序列中最高的四分之一和最低的四分之一,仅就中间的一半数值来测定数据的离散程度,通常用符号Q来表示。 方差variance 每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。 标准差standard deviation 不分组数据的标准差 SPSS: Descripitive Statistics→Frequentncies/Descripitves→Std.deviation Excel:插入函数STDEV 读取数据库文件:描述性统计·柯卉兵 分组数据标准差 Spss: Date→Weigh cases(考试成绩) Excel: 分步计算 变差系数Coefficient of Variation(1) 两个或多个样本所测的特质不同,即所使用的观测工具不同。 即使使用的是同一种观测工具,但样本的水平相差较大 。 变差系数Coefficient of Variation(1) 偏度Skewness 正态分布时,偏度为0 正偏:均值会人为地高估数据集中点 负偏:均值会人为地低估数据集中点 峰度Kurtosis 标准正态分布时,峰度为0 峰度为正值,分布要比标准正态峰高 峰度为负值,分布要比标准正态峰低 作业 读取数据文件“描述性统计(考试成绩)” 1.分别计算X1和X2的平均数、中位数、标准差、离差系数。 2.运用Explore对X1和X2的分布状况进行分析。 3.构建X1和X2的crosstab分析表 一个建议 请参阅范文(柯卉兵),通过《中国统计年鉴》或其他统计资料收集数据,运用描述性统计的方法写作小论文。 * * Q1为第1四分位数; Q3为第3四分位数 S:标准差; :平均数 CV:变差系数 *
文档评论(0)