第二讲单变量的统计描述课件.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲单变量的统计描述课件

第二讲 单变量的统计描述 变量层次的划分 A. 定类层次; B. 定序层次; C. 定距层次 变量的统计描述 A. 分布 统计表 统计图; B. 集中趋势测量法; C. 离散趋势测量法 一、变量的层次 1、定类变量 定类变量是变量层次最低的,它的取值只有类别属性之分,而无大小程度之分.如民族,婚姻等. 2、定序变量 定序变量的层次高于定类变量.它的取值除了有类别属性之外,还有等级次序的差别.常见的如受教育程度,满意度,社会经济地位等. 3、定距变量 定距变量的层次又高于定序变量.定距变量的取值,除了具有次序属性外,取值之间的距离可以度量.如家庭住房面积,家庭人口数等. 4、定比变量 定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、密度和速度等数量关系。例如将家庭人口数与家庭总支出对比计算家庭人均支出水平。 二、单变量的统计描述方法 (一)分布 统计表 统计图 1、 分布 统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如住房产别包括12种情况,按被访人的回答,可以得到12对数据:(x1,n1),(x2,n2)…(x12,n12). 括号中的第一项表示变量的可能选项,第二项表示所对应的频次。 需要注意的是: (1) 变量取值必须完备,只有这样才能使被访者一一无遗地进行归类。(2) 变量取值必须互斥,这样才能使每一个观察值归入一类,且仅仅归入一类。 2、统计表 用表格形式来表示变量的分布。统计表必须具备的内容有:表号(统计表x,x),表头(包括标题、时间、地点),标识行(产别、频数、频率), 主体行(第一项位置,按列填写变量的不同选项;第二项位置,按列填写变量取值相应的频次和百分比等等)。要写明统计的总数。表尾需要写清资料来源。 定类变量的统计表 表1、天津市居民住房的产别分布(1997) 定序变量统计表 表2 某企业员工的教育水平 定距变量统计表 表3、天津市不同收入组居民的住房与收入现状(1997) 定距变量制表需要考虑的问题 1、组数 组数太少会掩盖变量变动时频次的变化,组数太多,会使每组内频次过少,看不出明显的规律。一般根据理论和经验进行分组。 2、等距分组与非等距分组 一般情况下采用等距分组,但研究一些特殊问题,如贫困问题,需要对低收入分得细一些。 3、组限(class limits)就是每组的范围,包括上限和下限。对于离散型变量一般采取相邻组限不重叠的原则,而对于连续型变量,可能出现相邻组限重叠的情况,这时采取的原则就是“上组限不在内”原则。 4、分组步骤 第一,搜集数据; 第二,在数据中找出最大值L, 最小值S及极差值R; 第三,把数据分组,如K组; 第四,计算组距h; 第五,计算组中值 。 3、统计图 定类变量:圆瓣图;条形图 定序变量:条形图 定距变量:直方图;折线图 (二)集中趋势测量法 (1)集中趋势测量法 (measures of central tendency):就是找出一个数值来代表变量的资料分布,以反映资料的集结情况。该方法的意义,就是根据该代表值(或称典型值)来估计或预测每个研究对象的数值。 (2)运用该方法要舍去 变量的某些信息,但由于所根据的数值最有代表性,所产生的误差最小。 (3)有三种方法供选择集中值:一是根据频次,哪个变量值具有的频次最多,就选择哪个变量值。二是根据居中。三是根据平均。 表4、各种集中趋势量度的比较 众值、中位值和均值的比较 (1)三者设计的目的是相同的,都是希望一个数值来描述整体特征,以便简化资料。 (2)众值仅使用了资料中最大频次这一信息,因此,资料中信息的使用是不完善的。 (3)虽然均值对资料的信息利用充分,但对严重偏态的分布,会失去它应有的代表性。 (4)对于对称的图形,三者位置重叠,当图形正偏或负偏时,均值变化最快,中位值次之,众数不变。 (二)离散趋势测量法 (1) 离散趋势测量法(measurements of dispersion),是要求出一个值来表示个案与个案之间的差异情况。 (2)试比较以下两个班次考试成绩: 甲:100, 90, 80, 70, 60, 50, 40 乙:85, 80, 75, 70, 65, 60, 55   如果仅用集中趋势测量法来测量两个班的成绩,两班是相等的。但两班的分布显然有差异,需要考虑资料的分散特征。 表5、各种离散趋势量度的比较 (3)离异比率(异众比率)(Variation Ratio) 离异比率就是非众值的次数与全部样本数目的比率。公式如下:   

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档