十章单量的描述统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十章单量的描述统计

第十章 单变量的描述统计 本章主要内容:描述统计的基本方法、集中趋势与离散趋势分析。 第一节 描述统计的基本技术 描述性分析是对已经初步整理的数据资料进行分析,并用统计量对这些资料进行描述的一种方法; 描述统计只是描述样本属性或变量关系,是对样本观察的结果。 一、频数与频数分布 二、统计表 三、统计图 一、频数与频数分布 统计学中的分布:是指一个变量的各个取值出现的次数或频率。 频数分布(Frequency distribution):就是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。 频率分布(percentages distribution)是一组数据中不同取值的频数相对于总数的比率分布情况. 常以百分比的形式来表达. 二、统计表(Statistical tables) 统计表 是用表格形式表示变量的分布。 统计表结构 统计表类型 统计表格(结构) 从外表形式上看,统计表由序号、总标题(表的名称)、标目(横行标题、纵栏标题)、表身(指标数值)、表注四部分组成。 表注。写于表的下面。对标题补充说明;或说明数据来源、附记等内容。 2.简单分组表(总体仅按一个标志进行分组) 某村各户年人均收入统计表 3.复合分组表 是总体按两个以上标志进行层叠分组的统计表,它又称为交互分类表,它能表现两个分组标志之间的关系。 某村家庭规模和经济情况统计表 三、统计图(Statistical graphs) 即用图形的形式来表示变量的分布。 1.圆瓣图(pie graphs) 2.条形图(Bar graphs) 3.直方图(Histograms) 4.折线图 (Polygon) 圆 瓣 图(pie graphs) 条形图(Bar graphs) 直方图(Histograms) 折线图(Polygon) 第二节 集中趋势测量 集中趋势是指反映变量分布的特征值。该特征值又称作集中量数 它是代表一组数据典型水平或集中趋势的量,反映频数分布中大量数据向某一点集中的情况。 一、定类变量:众数 二、定序变量:中位数 三、定距变量:平均值 四、众数、中位数、平均数的比较 一、定类变量:众数 众数(简写Mo)是一组数据中出现次数最多(即频数最高)的那个数值 众数与平均数一样也可用来概括反映总体的一般水平或典型情况. 其计算方法分两类: (1)单值分组资料(观察法) 最大的频数—对应的标志值=众数 (2)组距分组资料 (组中值法) 最大的频数—对应的组—组中值=众数. 众数示例 二、定序变量:中位数 中位数(Md)把一组数据按值的大小顺序排列起来,处于中央位置的那个数值就叫中位数. 计算中位数有下面两种情况: (1)用原始资料 三、定距变量:平均值 组距分组资料计算平均数—示例 四、众数、中位数、平均数的比较 三者都反映了变量的集中趋势,但各自适用对象稍有不同: 众值:适用于定类、定序、定距变量; 中位值:适用于定序、定距变量; 均值:适用于定距变量。 一般说来均值利用了更多的信息,更全面和准确.其稳定性要好。 两种不适用均值的情况: ①当资料是有开口组的定距测量时,只能用中位数. ②平均数容易受到极端值的影响,中位数则不会受到这种影响.当存在很大极值时,宜用中位数 . 第三节 离散趋势测量 它是利用离散量数 测量离散或离中程度 离散量数 是用反映一组数据相互之间的离散程度的数值.它是变量分布的特征值。 一、定类变量:异众比率 二、定序变量:四分位差 三、定距变量:标准差与方差 四、相对离散程度:离散系数 一、定类变量:异众比率 异众比率 是指非众数的次数与总体内全部总体单位的比率。 众数与异众比率配合使用。异众比率越小,众数的代表性越大。 计算公式: V= 其中n 是全部观察总数, 是众数出现的频数,二者之差就是非众数的频数. 不属于众数的个案所占的比率愈大,就表示众数的代表性愈小,以之作估计或预测时所犯的错误也就愈大。 一种可能的情况是:两两比较,众数相同,而异众比率不同。 二、定序变量:四分位差 把一组数据按大小排列成序列,然后分成四个数据数目相等的段落,各段落分界点上的数,叫四分位数。(即每组占25%) 舍去资料中数值最高的25%和最低的25%,仅就中间50%数据求其量数作为离中量数,即四分位差。 计算公式: - 图中表示原始数据四个等分。Q2就是中位数,两边各有50%的个案。 计算四分位差时,先要求出Q1的位置和Q3的位置. 实际资料,分为原始资料与分组资料两种情况。 三、定距变量:标准差与方差 方差(Variance):是将观察值与其均值之差的平方和,除以全部观察总数。 标准差(Standand Deviation) :一组

文档评论(0)

181****9125 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档