第十一章-定量资料分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章 定量资料分析 第一节 资料的整理与录入 第二节 单变量统计分析 第三节 双变量统计分析 第四节多变量统计分析 第一节 资料整理的整理与录入 一、资料的审核 指研究者对所收集到的原始资料进行初步的审阅,校正错误、剔出乱填、空白和严重缺答的废卷。目的是使原始资料具有较高的准确性、完整性和真实性,为数据录入和分析打下基础。 数据的审核 (原始数据) ? 审核的内容 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等 数据的审核 (原始数据) ?审核数据准确性的方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误 主要用于对定距和定比数据的审核 数据的审核 (第二手数据) 适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要 时效性审核 应尽可能使用最新的统计数据 确认是否必要做进一步的加工整理 数据的筛选 对审核过程中发现的错误应尽可能予以纠正 当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容包括: 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出 统计分析概述 统计分析就是运用统计学的方法对调查得到的数据资料进行定量分析,以揭示事物内在的数量关系、规律和发展的一种资料分析方法。其主要作用: 1 为研究提供一种清晰准确的形式化语言,对资料进行简化和描述。 如对人们在一胎化政策实行前的行为进行研究,可以发现生育行为受文化程度的影响。从总体上看,文化程度高的妇女其子女数量少于文化程度低的妇女。用定性分析的方法只能得出这样一个概略的认识。采用定量方法进行分析就可以将这种关系提炼成一个数学方程式:Y=4.38-0.16X。Y代表任何一个妇女生育子女的数量,X代表文化程度。从这个方程中可以看出,每提高一组文化程度,就可以少生0.16个孩子。 第二节 单变量统计分析 主要分为两个大的方面,即描述统计和推论统计。 描述统计的主要目的在于用最简单的概括形式反映出大量数据资料所容纳的基本信息。包括集中趋势分析、离散趋势分析等。 推论统计的主要目的,是从样本中所得到的数据资料来推断总体的情况,它主要包括区间估计和假设检验等。 描述统计 内容 搜集数据 整理数据 展示数据 目的 描述数据特征 找出数据的基本规律 推断统计 内容 参数估计 假设检验 目的 对总体特征作出推断 描述统计与推断统计的关系 (3)定距层次:算术平均数 通常称平均数,又称均数或均值。英文为Mean,故以M表示。如果是由变量X计算得来的就记为 (读X杠),现在一般都以 表示样本的平均数,以U 表示总体的平均数。 算术平均数就是各个变量值相加求和再除以变量的总次数。 算术平均数的计算方法 1、用原始数据计算平均数 。当一组数据个数不多时,可直接用原始数据来计算。 如某实验小组10人的实验成绩为11,13,15,16,16,16,17,18,18,20。其平均数为: 2、用频数分布表求平均数 。如果样本的数据很多,达到数十个或数百个,则需编制频数分布表,用频数分布表求平均数。 2.离散量数分析 离散趋势指的是测量值围绕中心值——比如平均值——的分布。极差就是个简单例子。如我们可以报告说平均年龄是37.9,范围是从12到89岁。 离散(中)量数分析 指的是用一个特别的数值来反映一组数据相互之间的离散(中)程度.即各组数据相对于平均数的差异程度(离中程度)。差异程度小,平均数的代表性高;差异程度大,代表性低。 它与集中量数一起分别从两个不同的侧面描述和揭示一组数据的分布情况。共同反映出资料分布的全面特征,同时它还对现各集中量数的代表性做出补充说明。 示例: 某三个班各选5名同学参加测试.他们的成绩分别如下 中文系:78, 79, 80, 81. 82 X = 80 数学系:65, 72, 80, 88, 95 X = 80 外语系:35, 78, 89, 98, 100 X = 80 如果仅以集中量数来衡量,这三个队的水平一样高,但是很明显.这80分对中文系队的同学代表性最高,而对外语系的同学代表性最低. 全距(R) 全距也叫极差,它是一组数据中,最大值与最小值之差. 它是表示数据分布离散程度最简单的方式,即一组数据中最大数与最小数差,故称两极差。 例:某校三个系各选5名同学,参加智力竞赛

文档评论(0)

霞霞147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档