- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第一章导论与统计基础知识方法——SP社会统计分析SS软件应用(第二版)(新编21世纪社会学系列教材;教育部高等学校社会学学科教学指导委员会推荐教材;全国普通高等学校优秀教材)作者:郭志刚SPSS是发展较早、应用非常普遍的社会统计软件包。它具有十分强大的数据处理、统计分析功能,同时又具有易学、易用的特点。因此,本书所介绍的高级统计方法将以SPSSforWindows第13版及其他更新版本作为应用软件。本书是一本多元统计分析方法教材,主要目的是介绍和讲解各种统计方法的原理与应用。为了方便读者将这些分析方法投入使用,示范了用SPSS软件分析例题的操作。对一些统计知识和SPSS软件两方面基础均较为薄弱的读者,本章第三节和第四节分别提供了一些初级统计知识要点的复习和SPSS软件入门的简介。另外本书还设有一章,介绍事件史数据的预处理。一、关于本书各章的简介为了建立这些方法的分类框架,需要具备一些统计学基础知识,即变量测度等级的概念。下面第一小节是对变量测度等级的简介。然后,在第二小节中对各种方法做一概括。第三小节将按照各种方法应用的变量条件列出一个框架图。(一)变量的测度等级在科学研究中,用变量来量化描述概念。但是不同概念能够被量化的程度有所不同,另外即使一个概念实际上具备较高的量化程度,而在实际观测时也可能因为具体情况而采用较低的量化程度。这种量化程度在统计学中称为变量的测度等级或测度水平。变量的测度等级直接关系到统计分析方法的选择。变量的测度等级的划分有多种,一般常用的划分为四种,即:名义测度、序次测度、间距测度、比率测度。名义测度名义测度是最低的一种测度等级,也称定名测度。实际上,名义测度变量的值只代表类型的编码,而这些编码的数值只是一个符号,数值之间不存在有实际意义的量的关系。比如,性别便是一个名义测度等级的变量,可以将男性编码定为1,女性编码定为2。序次测度序次测度的量化水平高于名义测度,也就是说它所包含的信息量大于名义测度等级的变量。因为在序次测度等级的变量中,变量编码不仅具有分类的作用,而且也存在量的关系。比如,受教育程度这个序次测度等级的变量,采用数字编码表示不同类别,比如:文盲半文盲=1,小学=2,初中=3,高中=4,大学=5。间距测度间距测度等级的量化程度更高,它的取值不再是类的编码,而是采用一定单位的实际测量值。这时不仅可以知道两个不同变量值存在差异,而且可以应用减法得到两值之间的差或应用加法得到两值之间的和,它们的差与和都有实际意义。但是,间距测度等级的变量值之间不能进行乘除计算。比率测度比率测度是最高级的测度等级,它除了具有间距测度等级的所有性质外,而且其0值是非人为制定的,比如K温度中的0度被称为绝对0度。(二)本书所介绍的分析方法的概述多元线性回归应用于单方程模型,其因变量必须为测量型变量,其自变量既可以为测量型变量也可以采用虚拟变量等特殊编码变量。研究目的是分析因变量值的变化与自变量值变化之间的关系。多元回归用最小二乘法求解回归系数。如果变量之间有多层因果关系,便可以由多个具有内在联系的多元回归方程组成一套通径分析联立方程组。在满足特定条件的情况下,每个方程都可以通过多元回归求解系数,然后应用通径分析分解变量之间的直接作用和间接作用。如果一套联立方程组中含有潜在变量(即不可直接观测的变量),便不能再用最小二乘法求解,这时可以应用结构方程模型,它主要采用最大似然估计求解。在研究有两组各包含多个变量的变量组之间的关系时,可以采用典型相关分析。典型相关分析的所有变量必须为测量型变量或虚拟变量。多元方差分析研究两个以上的类别中在多项测量型数据指标上是否存在显著差异。当因变量为分类变量或序次变量且自变量为测量型变量和虚拟变量时,不能采用常规的多元线性回归,而应该采用logistic回归。当因变量为计数变量(即有限的正整数值)且自变量为测量型变量和虚拟变量时,则应该采用泊松回归。鉴别分析主要应用于在已知一些案例的各种条件值及其结果类型的条件下,形成鉴别方程,然后将其应用于其他条件值已知但结果类型未知的案例,预测它们的结果类型。这种方法可以视为因变量为多分类结果、自变量为测量型或虚拟变量的因果预测。它的主要应用目的是进行鉴别分类。在使用纵贯数据进行因果分析时,事件史分析是可以应用的分析技术。其中,离散时间模型实际上就是用logistic回归求解。而Cox比例风险模型是连续变量模型,它分为两种,一种包括动态变量(即随时间变化的自变量),另一种不包括动态变量。事件史分析的数据处理是一项比较复杂的工作,本章第十四章专门介绍这方面的技术。至于因子分析、聚类分析和对应分析,它们并不是因果模型,分别用以分析变量、案例和类型(变量值)之间的结构关系。它们被称为相依模型。因子分析经常服务于浓缩多个测量型变量,使之转换为较少数量的新变量(
您可能关注的文档
- 社会调查中的问卷设计 第三版 课件 第1、2章 社会调查概述、 测量与操作化.ppt
- 社会调查中的问卷设计 第三版 课件 第9、10章 问卷设计中常见错误分析、实例分析.ppt
- 社会调查中的问卷设计 第三版 课件 第7、8章 问题和答案的设计、问卷设计中的其他问题.ppt
- 社会调查中的问卷设计 第三版 课件 第3、4章 问卷与问卷设计、 问卷的结构.ppt
- 社会调查中的问卷设计 第三版 课件 第10、11章 实例分析、 如何把问卷设计得更好.ppt
- 数据科学优化方法 课件 孙怡帆 第1--6章 导论、 无约束最优化方法基础---拟牛顿方法.pptx
- 数据科学优化方法 课件 孙怡帆 第7--12章 共轭梯度方法---交替方向乘子方法+附录A 数学基础.pptx
- 农村社会学(第三版) 课件 第13、14章 农村社会分层、 农村社会流动.pptx
- 农村社会学(第三版) 课件 第15、16章 农村卫生、 农村社会保障.pptx
- 农村社会学(第三版) 课件 第16、17章 农村社会保障、 城乡统筹.pptx
文档评论(0)