数学建模讲座-多元统计分析课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模讲座-多元统计分析课件.ppt

K-means快速聚类 (二)思路 1.指定最后要聚成K类 2.用户指定k个样本作为初始类中心或系统自动确定k个样本作为初始类中心 3.系统按照距k个中心距离最近的原则把每个样本分派到各中心所在的类中去,形成一个新的k类,完成一次迭代 4.重新计算k个类的类中心(计算每类各变量的均值,以均值点作为类中心) 5.重复3步和4步,直到达到指定的迭代次数或达到终止迭代的条件 K-means快速聚类 (二)思路 SPSS中两个判断聚类是否结束的条件,满足其中一个即可结束聚类过程. 达到指定迭代次数(maximum iteration),默认10次。 收敛标准(convergence),默认0.02,即:本次迭代产生的任意新类,各中心位置变化较小.其中最大的变化率小于2%. K-means快速聚类 (三)基本操作步骤 A.菜单选项:analyze-classify-k means cluster B.选定参加快速聚类分析的变量到variables框 C.确定快速聚类的类数(number of clusters).类数应小于个案总数 D.选择聚类方法(method):默认iterate and classify,即:在聚类的每一步都重新计算新的类中心 E.确定聚类终止条件(iterate) K-means快速聚类 (四)其他 1. 保存快速聚类的结果(save) cluster membership:将各个案所属类的类号保存到qcl_1变量中 distance from cluster center:将各样本距所属类中心的距离保存到qcl_2变量中. K-means快速聚类 (四)其他 2.输出选项(option) initial cluster centers:输出初始类中心点 ANOVA table:输出各类的方差分析表 cluster information for each case:输出每个样本的分类结果和距离 K-means快速聚类 (四)其他 3. use running means项: 选中:表示每个样本被分配到一类后立即计算新的类中心。聚类结果与个案的先后次序有关. 不选中:表示完成了所有个案的依次分配后再计算类中心.省时. K-means快速聚类 (四)其他 4.用户指定类中心(center) read initial from:若不指定则系统自动确定初始类中心。指定则从某.sav文件中读入初始类中心数据(应设一个名为Cluster_的变量名)。 Write final as:在分析的最后将各类中心写入某.sav文件 因子分析 因子分析的提出 为尽可能完整描述一个事物,往往要收集它的许多指标 多指标产生的问题: 计算处理麻烦 信息重叠 从众多的指标中剔除一些指标又会造成信息丢失 因子分析的基本思想 因子分析的基本出发点 将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差) 这些综合指标之间没有相关性 因子变量的特点 这些综合指标称为因子变量,是原变量的重造 个数远远少于原变量个数,但可反映原变量的绝大部分方差 不相关性 可命名解释性 因子分析的基本步骤 确认待分析的原始变量是否适合作因子分析 构造因子变量 利用旋转方法使因子变量具有可解释性 计算每个样本的因子变量得分 因子分析的数学模型 数学模型(xi为标准化的原始变量;Fi为因子变量;kp) 也可以矩阵的形式表示为: X=AF+ε F:因子变量 A:因子载荷阵 aij: 因子载荷 ε: 特殊因子 因子分析的相关概念 因子载荷 在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大,则Xi与Fi的关系越强 变量的共同度(Communality) 也称公共方差。Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和 可见:Xi的共同度反应了全部因子变量 对Xi总方差的解释能力 因子分析的相关概念 因子变量Fj的方差贡献 因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和 可见:因子变量Fj的方差贡献 体现了同一因子Fj对原始所有 变量总方差的解释能力 Sj/p表示了第j个因子解释原所 有变量总方差的比例 原有变量是否适合作因子分析 计算原有变量的相关系数矩阵 一般小于0.3就不适合作因子分析 确定因子变量--主成份分析 主成份分析法的数学模型 : 该方程组要求: 将原有的P个相关变量Xi作 线性变换后转成另一组不 相关的变量Yi 确定因子变量--主成分分析 系数uij依照两个原则来确定 yi与yj (i≠j,i,j=1,2,3,…p)互不相关; y1是x1,x2,x3,…,xp的一切线性组合(系数满足上述方程组)中方差最大的;y2是与y1不

文档评论(0)

huaz15718 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档