第一讲 变量及其关系幻灯片.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
调查数据分析与SPSS软件应用 陈卫 中国人民大学人口与发展研究中心 自我介绍 中国人民大学人口与发展研究中心教授 《人口研究》杂志常务副主编 澳大利亚国立大学社会学博士 授课:社会统计学、定量研究方法、调查数据分析与SPSS软件应用 研究兴趣:生殖健康、老龄化 Email:weichen@ 第一讲 变量及其关系 变量类型 统计检验 一、变量(数据) 类型 变量(数据) 可以分为四类: 名义变量、序次变量、间距变量、比率变量。 (定类、定序、定距、定比 ) 了解变量(数据)类型很重要,因为不同类型的变量(数据)往往使用不同的统计方法进行分析。 名义(定类)变量 名义变量是最简单的一种数据类型, 表示为没有次序的类别。如果只有二类,就是二分类变量,如果是三类或更多类,就叫多分类变量。 最常见的名义变量就是性别。性别只有二类:男性和女性。并且没有次序之分,即某一类并不高于、大于或好于另一类。习惯上我们用1表示男性,2表示女性。这样赋值是随意的,没有任何的数学或统计学上的理由。 名义变量 根据变量值,只能知道研究对象是相同或不同。 从数学运算特性来讲,名义变量只能有等于或不等于的性质。 名义变量 三类及以上的名义变量就更多了。例如,宗教、职业、婚姻状况、居住地、省份、民族、国家等。 类别的排列和赋值没有任何实际意义。 2002年全国职工队伍状况调查 有很多名义变量,例如省份、地区、性别、户口、政治面貌、宗教信仰、民族、职业等 序次(定序)变量 序次变量与名义变量类似,所不同的是各类是有次序之分的,即由小到大、由低到高排列,或相反。 比如按照人口规模大小排列:中国第一, 印度第二, 俄罗斯第三,美国第四,日本第五,等等。 2006年中国各省人口排序 序次变量 文化程度是序次变量,可以分为: 1=文盲、半文盲 2=小学 3=初中 4=高中 5=大专及以上 第 3类肯定高于第1和第2类,但是类与类之间的距离是不相等的。 每个人可以按照某种特征分类: 您是否同意禁止性别选择? 序次变量 由于序次变量的取值除了有类别属性之外,还有等级、次序的差别,所以,其数学运算特性除具有等于或不等于之外,还有大于或小于之分。 2002年全国职工队伍状况调查 健康状况、文化程度、技术等级(职务等级) 您所在单位履行劳动合同的情况如何? 您目前的工作是否稳定? 您对您目前从事的职业是否满意? 您的家庭生活水平与5年前相比有何变化? 对不同职业的社会地位、经济地位的评价 名义变量和序次变量统称为分类变量(离散变量)。 分类变量不能用来进行数学计算或转换,比如计算平均数。 间距变量 对于间距变量,次序和数量都很重要。间距变量的值就是变量的实际值。间距变量只能取具体的值。比如:年龄、身高、体重等。这些变量都是以0为最低值,而且每二类之间差异都是相等的。比如2个孩子和1个孩子的差等于5个孩子和4个孩子的差。 受教育年限 比率变量 受教育年限是间距变量,但是实际上它是测量等级更高的变量,叫比率变量。 间距变量和比率变量几乎相同。它们的区别在于0的意义。对于间距变量,0不是绝对0;而对于比率变量,0就是绝对0、真正的0,也就是说该变量完全不存在。 例子:温度 摄氏和华氏温度,0度并不是没有温度,还有0度以下的温度。 开氏温标(也叫绝对温标),0就是绝对零度 (相当于摄氏-273 度,在此温度下分子停止运动 ),开氏温标计上没有0下的温度。 比率变量 社会科学中的许多序次等级以上的变量都是比率变量。比如,钱(元、角、分)、体重、身高、年龄。 在社会科学中,只满足间距变量而不能同时满足比率变量的情况极为少见。实际上,真正可算间距变量的,大概只有智商(IQ)了。 2002年全国职工队伍状况调查 年龄、受教育年限、工龄 您上一周实际工作了多少小时? 您上月从本单位获得的全部货币收入(元) 间距变量 在社会学科中一般不区分间距变量和比率变量,而是当作一类,称为间距变量。 间距变量的数学运算特性除了等于、不等于、大于、小于之外,还可以加减乘除。 离散变量和连续变量 上述四类变量又可以分为二大类:离散变量和连续变量。 离散变量就是 名义变量和序次变量。把人、物、事按照他们的性质或特性划分。离散变量也叫分类变量。 连续变量 就是间距变量和比率变量。把人、物、事按照他们的某一特征的数量进行划分。 个案 就是调查数据所描述的对象。可以是人、动物、事物。社会调查研究的对象就是人。 变量就是指所研究对象的特征,对于不同的人某个变量的值可以不同。 2002年全国职工队伍状况调查数据: 数据所描述的对象或个案就是职工,对于每个职工都有许多

文档评论(0)

love87421 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档