- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会调查理论与方法(2010版)第十三章
第十三章 定量资料分析 一、数据处理的步骤 二、单变量统计分析 三、双变量统计分析 四、多变量统计分析 一、数据处理的步骤: 1、资料审核: 为保证资料的准确性、完整性和真实性,研究者对原始资料进行初步的审阅,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷。分为实地审核和系统审核两类。 内容: (1)确认:通过回访、复查,确认问卷是否有效。 (2)编辑、整理:是否完整无遗漏;是否含糊不准确;口径是否统一。 2、数据编码(资料的转换): 编码是对一个问题的不同回答进行分组和确定数字代码的过程。也就是将问卷中的回答转换成数字的过程。 (1)单选题问题的编码: (2)开放式问题的编码: 列出答案;合并答案;设置编码;选定编码。 (3)多选题的编码和记录 1)多选项二分法(multiple dichotomy method): 2)多选项分类法(multiple category method):用于限选项的多选项中,即让被访者在较多的选项中,最多或限制选出几项。 3、数据录入: 将信息从计算机不可识别的形式转换成能够识别的形式的过程。 4、数据清理 (1)有效范围清理: 看数据中的数字是否超出编码值的有效取值范围。 (2)逻辑一致性清理: 依据问卷中问题相互间的某种内在逻辑联系,检查数据间的合理性。 (3)数据质量抽查: 采用随机抽样的方法,从样本的全部个案中,抽取一部分进行校对。 二、单变量统计分析: 单变量统计分析可以分为两个大的方面,即描述统计和推论统计: 描述统计的主要目的在于用最简单的概括形式反映出大量数据资料所容纳的基本信息。它的基本方法包括集中趋势分析、离散趋势分析等。 推论统计的主要目的,则是用从样本中所得到的数据资料来推断总体的情况,它主要包括区间估计和假设检验等。 1、单变量统计描述: (1)变量的分布 频次分布、频率分布; 统计表; 统计图:圆瓣图、条形图、直方图。 (2)集中趋势分析 用一个典型值或代表值反映一组数据的共性和一般水平,或者说反映这组数据向这个典型值集中的情况。 ①众值(Mo):出现频次的最高值。 ②中位值(Md):数据序列中央位置的变量值。 ③均值: (3)离散趋势分析 用一个典型值反映一组数据间的差异程度或离散程度。 ①异众比率: 非众数的各变量值的总频数在观察总数中的比例。 ②四分位差: 将数据序列四等分,则第三个四分位值(Q3)与第一个四分位值(Q1)之差,就是四分位差(Q)。 ③方差与标准差: 方差就是将观察值与其均值之差的平方和除以全部观察总数n。方差开方即为标准差。 σ2 = ∑(X-u) 2 /N 2、单变量统计推论: (1)区间估计 在一定可信度(置信度)下,用样本统计值的某个范围(置信区间)来估计总体的参数值。 如:“我们有95%的把握,全市职工月平均收入在1500—2000元之间。” 置信区间反映估计的精确性;置信度反映估计的可靠性或把握性。 样本量(n)一定时,两者成反比,即区间越大,精确度越高;区间越小,精确度越低。 (2)假设检验 先对总体的参数值作出假设,然后用样本的统计量进行验证,以决定假设是否为总体所接受。 基本思想:依据“小概率原理”,小概率事件在一次观察中不可能出现;如果现实的一次观察小概率事件发生了,我们就怀疑或否定该事件是小概率事件的说法。 检验步骤: ①建立假设:包括虚无假设和研究假设; ②选择显著性水平α(即小概率标准); ③依据样本数据计算出统计值,并根据显著性水平查出对应的临界值; ④判定:将统计值与临界值进行比较,决定是接受假设还是拒绝假设。 三、双变量统计分析: 双变量统计分析主要探讨两个变量之间的关系。根据变量层次的不同,这种分析所采取的具体形式也不一样。 1、交互分类与χ2检验(定类变量—定类变量): (1)交互分类 分析两个定类变量(或一个定类、一个定序变量)之间 关系的方法。 作用:对样本的分布情况和内在结构进行描述; 解释变量之间的关系。 例: 不同性别的人们对某政策的态度统计表(%) (2)χ2 (卡方)检验 从交互分类表中样本统计值反映的两变量关系,检验总体两变量之间是否也存在此关系。 χ2 = ∑(f0-fe) 2 /fe f0为交互分类表中每一格的观察频数; fe交互分类表中f0所对应的期望频数。 检验步骤: (1)建立两变量间无关系的假设; (2)计算χ2 值; (3)根据自由度(r-1)×(c-1)和给出的显著性水平
文档评论(0)