- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、单变量统计分析 二、双变量统计分析 一、单变量统计分析 1. 单变量描述统计 描述统计的目的在于用最简单的概括形式反映大量数据资料所容纳的基本信息,包括集中量数分析和离散量数分析。 (1)频数分布与频率分布 频数分布:一组数据中取值不同的个案的次数分布情况,它一般以频数分布表的形式表示。(P170) 频数分布表的作用: 第一、简化资料 第二、从频数分布表中,可以更清楚地了解调查数据的众多信息 频率分布 一组数据种不同取值的频数相对于总数的比率分布情况,常以百分比的形式表示。(P170) 频数分布表示不同类别在总体中的绝对数量分布,频率分布表是不同类别在总体中的相对数量分布。 (2)集中趋势分析 集中量数分析是用一个典型值或代表值来反映一组数据的一般水平,或反映这组数据向这个典型值的集中情况。 常见的集中量数有算术平均数、众数和中位数三种 算术平均数:总体各单位数值之和除以总体单位数目之商。统计学中习惯以 表示。 众数:一组数据中出现次数最多的数值 中位数:把一组数据按值大小顺序排列起来,处于中央位置的那个数值。 (2)离散变量的分析 离散变量指用一个特别的数值来反映一组数据之间的离散程度 例1:某校三个系各选5名同学,参加智力竞赛,他们的成绩分别如下: 中文系:78 79 80 81 82 X=80 S=1.414 数学系:65 72 80 88 95 X=80 S=10.8 英语系:35 78 89 98 100 X=80 S=23.8 离散变量 常见的离散变量统计量有:全距、标准差、异众比率、四分位差。 标准差:一组数据对其平均数的偏差平方和的算术平均数的平方根。 异众比率 一组数据中非众数的次数相对于总体全部单位的的比率。 四分位差 将一组数据按大小排列,然后将其4等分,去掉序列中最高的1/4和最低的1/4,中间的一半数值之间的全距。 离散系数 标准差与平均数的比值,用百分比表示。 2. 单变量推论统计 推论统计指用样本的统计值对总体参数进行估计的方法。推论统计的内容有两个:一是区间估计,二是假设检验。 区间估计指在一定的可信度下,用样本统计值的某个范围来估计总体的参数值。范围的大小反映的是这种估计的精确度,可信度的高低反映的是这种估计的可靠性或把握性。 (1)总体均值的区间估计 (2)假设检验 假设检验是先对总体的某一参数作出假设,然后用样本的统计量去进行验证,以决定假设是否为总体所接受。。 假设检验所依据的是概率论中的小概率原理,即“小概率事件在一次观察中是不可能出现的” 原理。 研究者将原假设作为虚无假设,将与之相对立的假设作为研究假设,然后用样本的数据计算统计量,并与临界值相比较,当临界值大于统计值的绝对值时,接受虚无假设,拒绝研究假设,否则,接受研究假设。 假设检验的步骤 建立虚无假设和研究假设 根据需要选择适当的显著性水平? ,通常选 ? =0.05和? =0.01两个水平; 根据样本数据计算出统计值,并根据显著性水平查出对应的临界值; 将临界值与统计值比较,若统计值的绝对值小于临界值,则接受虚无假设,否则,接受研究假设。 二、双变量统计分析 1、变量间关系 相关关系 (1)相关关系的概念:当一个变量发生变化时,另一个变量也随之发生变化。相关关系分析只适合定序以上变量间关系分析。 (2)相关关系的方向:分为正相关关系和负相关关系。 (3)相关关系的强度:两个变量之间相关关系的强弱或大小,用相关系数来表示。 (4)相关关系的类型:线性相关和非线性相关 (5)相关关系与散点图。 因果关系分析 (1)当一个变量发生变化时,会引起或导致另一个变量也随之发生变化。前一变量叫做自变量,后一变量叫做因变量。 (2)因果关系的条件 变量X和变量Y之间存在不对称关系 变量X和变量Y在发生的顺序上有先后之别 变量X和变量Y的关系不是同源于第三变量的影响 2。交互分类 交互分类(cross-tabulation)是一种专门分析两个定类变量(或一个定类变量,一个定序变量)之间关系的方法。将调查所得的一组数据按照两个不同的变量进行综合的分类,交互分类的结果通常以交互列联表的形式反映出来 交互分类表的作用 (1)可以较为深入地描述样本资料的分布状况和内在结构。 交互分类表的作用 表2 不同性别的人对某项政策的态度统计表(%) 交互分类表的作用 (2)通过分组比较可以对变量之间的关系进行分析和解释 表4 500名员工文化水平与工资收入交互分类表 表5 500名员工文化水平与工资收入交互分类表(%) 交互列联表的形式要求 每个表的顶端要有标号和标题 表格中的线条一定要规范,简洁,最好不用竖线 表中百分比号的处
文档评论(0)