第六章其他方法简介.ppt.pptVIP

下载本文档

7
0
约 23页
2016-12-02 发布于天津
举报
版权申诉

第六章其他方法简介.ppt.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第六章其他方法简介.ppt

第一节聚类分析简介聚类分析（ Cluster Analysis ）是根据研究对象的特征进行分类的多元分析技术的总称 ——组内同质、组间异质分类案例聚类的思想根据所选变量来对研究对象（case）进行分类聚类的结果仅仅反映所选定变量所定义的数据结构 ——变量选择十分重要依据：理论或经验所选变量的特征 1、和聚类分析的目标密切相关 2、反映了要分类对象的特征 3、在不同研究对象上的值有明显差异 4、变量之间不应该有高度相关 ——并非变量越多越好，应该只根据在研究对象上有显著差别的那些变量进行分类主要步骤 1、选择变量 2、计算相似性 3、聚类 4、聚类结果的解释和证实计算相似性 1、相关测度 2、距离测度 3、关联测度聚类方法 1、层次聚类法 2、迭代聚类法层次聚类法 1、聚集法先把每个案例看成一类，再根据距离一步步合并 2、分解法先把所有案例看出一类，再根据聚类一步步分解 ——费时 ——最终得到一个树状结构图迭代聚类法速度快，适用于大样本聚类 1、指定要形成的聚类数，对样本进行初始分类并计算每一类的重心 2、调整分类。计算每个样本点到各类重心的距离，把每个样本点归入距重心最近的那一类 3、重新计算每一类的重心 4、重复2-3步，直到没有样本点可以再调整为止聚类结果的解释和证实对聚类结果进行解释是希望对各个类的特征进行准确的描述，给每类起一个合适的名称通常的做法是计算各个类在各聚类变量上的均值，对均值进行比较分析，还可以使用聚类变量之外的其他变量，帮助描述各个类的特征，解释各个类差别的原因对聚类结果进行证实是要保证聚类解是可信的，具有一般性，可以进行推广。如果一个聚类解对于从同一总体抽出的不同样本重复出现，那么，我们可以说该聚类解具有一般性做法： 1、从同一总体中选取不同的样本进行聚类分析，对结果进行比较和评估 2、一般，常常把样本分成两组，分别做聚类分析，对结果进行比较，或者对同一数据采用不同的方法重复聚类 ——结果相同或接近，说明聚类解是稳定的。第二节鉴别分析简介聚类分析（ Cluster Analysis ）是根据研究对象的特征进行分类的多元分析技术的总称 ——组内同质、组间异质第三节对应分析针对的问题：对定性（Nonmetric）变量数据进行量化分析一般的应对方法往往用非线性统计方法，比如loglinear等，但在每个变量都划分成许多类别的情况下，这些分析方法就很难直观地揭示出变量之间的联系以及变量类别之间的关系。对应分析则有其他方法所不具备的长处一、什么是对应分析通过分析由定性变量构成的交互汇总表来揭示变量间的联系当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时，使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。而且，它不局限于分析线性关系基本形式：对由两个定性或类型变量构成的交互表进行分析，将定性变量数据转变成可度量的分值、减少维度并作出分值分布图。在减少维度方面（因子分析）作分布图（多维标度）第四节结构方程模型Structural Equation Modeling 一种统计建模技术多元回归、因子分析、通径分析等方法都只是结构方程模型中的一种特例简言之：结构方程模型还是利用联立方程组求解，但是它没有很严格的假定限制条件，同时允许自变量和因变量存在测量误差一、应用结构方程的五个主要步骤 1、模型设定：根据理论或者以往研究成果设定假设的初始理论模型 2、模型识别：决定所研究的模型是否能够求出参数估计的唯一解 3、模型估计：参数估计 4、模型评价：对模型和数据之间是否拟合进行评价，并与替代模型的拟合指标进行比较 5、模型修正：如果模型不能很好地拟合数据，就需要对模型进行修正和再次设定 ——一个拟合较好的模型往往需要反复试验多次二、模型的设定证实性的技术，而非探测性技术 ——研究人员主要是通过应用结构方程模型来确定一个特定模型是否合理，而不是将其用来寻找和发现一种合适的模型。设定模型的方法很多，最简单的就是通径图三、模型的识别考虑模型中每一个未知（自由）参数能否由观测数据求得唯一解作为估计对于某一个自由参数，如果不可能将这一参数以样本方差协方差的代数函数表达，那么这个参数就不能识别第七章其他方法简介第一节聚类分析第二节鉴别分析第三节对应分析第四节结构方程模型第五节方法纵览对案例聚类（Q型聚类）（为主）对变量聚类（R型聚类）研究实例简介