- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第9章资料的整理和分析;9.1定性资料的整理和分析;9.1.2定性资料的分析;9.2定量资料的整理和分析;3)编码手册
编码手册又称为编码簿,它是统一规定的、用来说明问卷中每个问题及其答案的符号所代表的意义以及编码细则的指导性文件,是编码员对问卷进行编码的依据。编码手册主要包括问题、变量名、变量意义、位宽、栏码和编码细则等内容。;3.数据清理
1)有效范围清理。对于问卷中的任何一个问题答案的编码来说,其有效编码值必然存在某种范围,当录入结果超出这一范围,可以肯定录入过程中出现了差错。
2)逻辑一致性清理。逻辑一致性清理的基本思路是依据问卷中的问题相互间存在的内在的逻辑联系,来检查前后数据之间的合理性。;9.2.2定量资料分析技术——统计分析基础;3)社会统计的内容、方法和程序
社会统计方法,就是指收集、整理与分析资料的研究技术或手段。
社会统计方法按其性质可以分为描述统计和推论统计
广义上,社会统计可以划分为5个阶段,即制订调查计划、统计调查上述后三个的内容、数据整理、统计分析和撰写统计报告;而狭义的社会统计程序具体包括统计方案制定、统计手段选取、统计结果分析和统计报告撰写4个方面。
;4)社会统计的基本概念
(1)总体和元素。所谓总体,就是指在某些共性基础上由许多个体构成的整体,它是所有构成元素的集合。所谓元素,则是指总体的基本单位,是构成总体的个体。
(2)样本。就是从总体中按一定方式抽取的一部分元素的集合。
(3)参数值和统计值。参数值是关于总体中某一变量的综合描述,统计值是对应于样本中某一变量的综合描述。
(4)变量。指有一个以上取值的概念。
(5)变量层次。根据测量层次(详见本书第5章的测量部分)可以把变量相应地分为定类、定序、定距和定比4个层次。;2.统计简化
1)频数分布。频数分布也叫次数分布,就是对变量取值出现的次数进行统计汇总,是一种基本的统计简化技术。
2)频率分布。频率就是每个变量的取值次数占总次数的比率,一般用百分比来表示。
3)累加频数。就是按顺序将变量取值的频数逐级相加。
4)累加频率。所谓累加频率(c%),???指将变量取值的百分比按一定顺序逐级相加。
5)数据分组。所谓数据分组,就是将原始的定距资料按值的大小划归到不同的、能够包含其值的、具有特定组限和组距的某个数据组中,将琐碎的、繁杂的定距资料通过分组呈现的方式直观地展现出来。;3.集中趋势测量法
集中趋势测量法是找出一个具体的数值来代表特定变量的资料分布,以反映资料的集中情况。
1)定类变量:众数。众数是在一组资料中,出现次数最多的变量值,用Mo表示。
2)定序变量:中位数。把定序变量的各个取值按大小顺序排列,位于正中间的那个变量值,即为中位数,用Md表示,其位置是(n+1)/2。
3)定距变量:均值。将其变量的各个数值相加,然后求一个平均数值代表变量的集中趋势,这个平均数值就是均值,用来表示。;4.离散趋势测量法
1)定类变量:异众比率。指非众数的频数与总体单位数的比值,用VR来表示。
2)定序变量:四分位差。在所有变量取值排序的资料中,四分之三位和四分之一位的个案取值的差异程度,用Q来表示。
3)定距变量:标准差。也称为均方差,其定义为各变量值对其均值的离差平方的算术平均数的平方根。;5.相关和回归分析
1)统计相关的性质
(1)相关关系。所谓相关,是指一个变量的值与另一个变量的值有连带性。一个变量的值发生变化,另一个变量值也相应发生变化,那么可以说这两个变量相关。
(2)因果关系。在有相关关系的两个变量中,如果明确说明了一个变量的变化引起了另一个变量的变化,那么这种关系就可以称为因果关系。
;2)消减误差比例
如果两个变量间存在一定的关联性,那么我们就可以通过一个变量去预测另一个变量,此时就会消减一定程度的由于盲目直接预测所带来的误差。
3)相关分析
在进行相关分析时,应选择具体的相关测量法(相关系数)。首先是变量的测量层次,然后看变量的关系是对称还是不对称的,最后优先选取具有PRE性质的相关测量法。
4)一元线性回归
回归分析的目的是进一步考查两个变量间的因果关系,并找出一种用自变量去预测因变量数值的最小误差方法,其中较为常用也较为简易的就是一元线性回归,即根据一个直线方程式,以自变量的数值来预测因变量的数值。;6.参数估计
参数估计是推论统计的第一种基本形式,是利用样本统计值对总体参数值进行推断或估计的统计过程和方法,在内容上分为点值估计和区间估计两种。
1)区间估计的基本概念
所谓区间估计,就是指在一定的置信水平下,根据样本统计值估算总体参数值可能落在的具有上下限数值的某个区间。
(1)置
文档评论(0)