LECTURE经济计量的基本问题与描述性分析资料.pptVIP

LECTURE经济计量的基本问题与描述性分析资料.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引例:作为一家企业的采购经理,向2家供货商订货,两家都能保证平均到货期限为10天内。但是据悉他们的供货的特征不同,如何选择? 现在我们就来讨论衡量数据分散程度的指标。 * 离散型数据:数据只能取整数。如一家公司的职工人数。 连续型数据:可以取介于两个数值之间的任意数值。如销售额、经济增长率等。 定类数据,这种数据只对事物的某种属性和类别进行具体的定性描述。如对人口按性别划分为男性和女性两类。 定序数据,也称序列数据,是对事物所具有的属性顺序进行描述。例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。 六、数据分析与检验 描述统计:关于搜集、展示一批数据,并反映这批数据特征的各种方法,其目的是为了正确地反映总体的数量特点。 推断统计:根据样本统计量估计和推断总体参数的技术和方法。 描述统计: 单变量截面数据的描述性分析 样本均值比较及检验 (一)单变量截面数据的描述性分析 集中趋势分析:众数(mode)、均值(mean)、中位数(median)、总和(sum) 离散趋势分析:极差(range)、四分位间距(quartile)、方差(variance)、标准差(standard deviation) 分布特征分析: 偏态(skewness),各观察值是否只对称地分布在中心的两侧,偏态系数额绝对值大于2,偏倚程度很大;峰度(kurtosis)各观察值是较为均匀地分布,还是侧重出现在中心附近,峰度系数为3一般称为常态峰,大于3高狭峰,小于3低阔峰。 1.集中趋势的描述 集中趋势(central tendency)反映的是一组数据向某一中心值靠拢的倾向。 数据的集中趋势通常用平均指标来反映。 集中趋势指标(平均指标)按计算方法不同分为: ㈠ 算术平均 ㈡ 调和平均数 ㈢ 几何平均数 ㈣ 中位数 ㈤ 众数 数值平均数 位置平均数 位置平均数与算术平均数的关系 1.众数(Mo)适用于所有的定性数据和定量数据 中位数(Me)适用于定性数据中的定序数据和定量数据 算术平均数只适用于定量数据 2.定量数据:若是钟形分布,三种集中趋势指标一般 都可适用。而对J形分布,反J形分布和U形分布,中位数和算术平均数没有任何意义。 3.在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息 。 4.对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系: X f X f X f (对称分布) 正偏态分布(右) 负偏态分布(左) 1 2 1 2 离散程度指标又称标志变异指标,离中趋势指标等,它反映变量分布离散趋势;常与平均指标匹配使用。 (1)评价平均数的代表性; (2)是对事物发展均衡性的量度:如供货计划完成的均衡性,协调性;产品质量的稳定性 作用: 2.离散程度的描述 种类 离散程度的绝对指标 离散程度的相对指标 极差、四分位差、平均差 极差(Range)也叫全距,是一组数据的最大值与最小值之离差,即: 四分位差(Interquartile range)是指第三四分位数与第一四分位数之差,也称为内距或四分间距,用Qr表示。 Qr =(M3- M1)/2 平均差(Mean deviation)也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用AD、MD表示。 方差(σ2 s2) 和 标准差(σ s) 标准差是所有观察值与平均数离差平方平均数的平方根,亦称均方差。标准差的平方即为方差。 简单来说,标准差是一组数据平均值分散程度的一种度量。 一个较大的标准差,代表大部分数值和其平均值之间差异较大; 一个较小的标准差,代表这些数值较接近平均值。 方差(σ2)和标准差(σ)是应用最广的标志变异指标 3.分布的偏态峰度 偏态(Skewness)是对分布偏斜方向和程度的测度。 变量分组后,总体中各个体在不同的分组变量值下分布并不均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。 偏态系数的数值一般在0与±3之间,越接近0,分布的偏斜度越小;越接近±3,分布的偏斜度越大 0负偏态 =0对称分布 0正偏态 峰度(Kurtosis)是分布集中趋势高峰的形状。在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度测度。 如果分布的形状比正态分布更高更瘦,则称为尖峰分布,见图(a);如果分布的形状比正态分布更矮更胖,则称为平峰分布,见图(b)。 3平顶曲线 =3正态曲线 3尖顶曲线 五数概括 :即最小值xmin 、最大值xmax 、第一四分位数M1、中位数Me和第三四分位数M3 五个数之间的关系,确定数据分布形态的方法: 数据是完全对称 : 数据是不对称 : 最小值xmin到中位数的距

文档评论(0)

基本资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档