教学课件 社会研究方法(第四版)风笑天.ppt

教学课件 社会研究方法(第四版)风笑天.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在对问卷中的问题进行编码时,要给不同的问题分配合适的栏码,即指定该问题的编码值在整个数据文件中所处的位置。 这种栏码有时在问卷设计时就印在问卷上(每页的右边,用一条竖线与问题及答案隔开),但也有很多情况下是在问卷收回后编码时再指定。 三、数据录入 录入方法: 1.登录表法 2.直接录入 3.光学扫描 4.条形码 四、数据清理 有效范围清理 对于问卷中的任何一个变量来说,它的有效编码值往往都有某种范围,而当数据中的数字超出了这一范围时,可以肯定这个数字一定是错误的。 有效范围数据清理 逻辑一致性清理 逻辑一致性清理则是从另一种角度来查找数据中所存在的问题。其基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。 例如 性别/怀孕次数 ; 无孩子/子女个数,年龄 未婚/配偶职业收入等;独生子女/兄妹个数,年龄 数据质量抽查 一个很简单的例子: 假设某个案的数据在“文化程度”这一变量上输错了,问卷上填答的答案是2(初中),编码值也是2,但数据录入时却错敲成了3(高中及中专)。 由于3这个答案在正常有效的编码值范围中,因此,前一种方法检查不出这一错误。同时,这一变量值与其他变量之间又没有前述那样的逻辑联系,因此后一种方法也用不上。 第二节 单变量统计分析 一、单变量描述统计 单变量统计分析可以分为两个大的方面,即描述统计和推论统计。描述统计的主要目的在于用最简单的概括形式反映出大量数据资料所容纳的基本信息。它的基本方法包括集中趋势分析、离散趋势分析等。而推论统计的主要目的,则是用从样本中所得到的数据资料来推断总体的情况,它主要包括区间估计和假设检验等。 描述统计 内容 搜集数据 整理数据 展示数据 目的 描述数据特征 找出数据的基本规律 0 25 50 Q1 Q2 Q3 Q4 ¥ 推断统计 内容 参数估计 假设检验 目的 对总体特征作出推断 样本 总体 描述统计与推断统计的关系 反映客观现象的数据 总体内在的数量规律性 推断统计 (利用样本信息和概率论对总体的数量特征进行估计和检验等) 概率论 (包括分布理论、大数定律和中心极限定理等) 描述统计 (统计数据的搜集、整理、显示和分析等) 统计学探索现象数量规律性的过程 集中趋势分析 集中趋势分析指的是用一个典型值来反映一组数据的一般水平,或者是反映这组数据向这个典型值集中的情况。 这样一个典型值就被称为集中统计量。 按照处理方式不同集中统量可分为几类,两最常见的集中趋势有算术平均值、众数和中位数三种。用得最多的是平均数。 1 定类层次:众值(众数) 其意义为,在众多数值中,出现次数最多的一个数值。 (1)原始资料,求众值 例如:2,3,5,5,5,6,6,7,8 出现次数最多的是5,其M0=5 (2)次数资料,求众值 例如:江村女青年找对象的标准 标准 相貌 人品 文化 健康 职业 能力 经济条件 政治条件 家庭背景 感情 人数 55 122 51 104 13 29 16 13 6 82 其次数最多的为人品122人次,所以M0=人品 (3)分组的频数表中,频数最大的区间的组中值就是众值 区间 组中值 频数 75-79 77 1 70-74 72 3 65-69 67 5 60-64 62 10 55-59 57 4 50-54 52 2 表中频数最大的为10,对应的区间是60-64,其组中值是62,所以众值=62。 如果在一个次数中出现两个邻近的次数较多者,众数是二次数多的组中值的平均值 2 定序层次:中位值(中位数)(单选) 其意义为按大小顺序排列,处在一群数据中央位置的数值。 (1)原始资料,求中位值 例如:有9个人,他们的月工资分别如下: 47,42,50,51,92,112,71,83,108 首先作排列处理,从小到大排列 42,47,50,51,71,83,92,108,112 其次求中央位置 Md的位置=(N+1)÷2=(9+1)÷2=5 最后求中位置Md=71 (3)定距层次:算术平均数 通常称平均数,又称均数或均值。英文为Mean,故以M表示。如果是由变量X计算得来的就记为 (读X杠),现在一般都以 表示样本的平均数,以U 表示总体的平均数。 算术平均数就是各个变量值相加求和再除以变量的总次数。 = = 离散量数分析 离散趋势指的是测量值围绕中心值——比如平均值——的分布。极差就是个简单例子。如我们可以报告说平均年龄是37.9,范围是从12到89岁。 离散(中)量数分析 指的是用一个特别的数值来反映一组数据相互之间的离散(中)程度.即各组数据相对于平均数的差异程度(离中程度)。差异程度小,平

文档评论(0)

喜宝 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档