多元统计分析(2013)..pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析 二、判别分析 1.判别分析的意义与功能 判别分析的意义在于根据已知样本的分类情况来判断未知的样本的归属问题。 2. 基本思想 首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i类得重心距离最近,就认为它来自第i类。 二、判别分析 问题:设有两个总体(或称为两类)G1,G2,从第一个总体中抽取n1个样品,从第二个总体中抽取n2个样品,每个样品测量p个指标如下表。 二、判别分析 今任取一个样品,实测指标X=(x1,…,xp)’ 问X应判为哪一类? 二、判别分析 例1.我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的15个大气取样点,每日4次同时抽取大气样品,测定其中含有的6种气体浓度,前后共4天,每个取样点每种气体实测16次。计算每个取样点每种气体的平均浓度,数据如表所示,气体数据对应的污染地区分类如表中最后一列所示, 二、判别分析 二、判别分析 二、判别分析 利用matlab工具箱函数求解 函数名称:classify 调用格式[class, err]=classify (sample, training, group) 注意:sample与training具有相同的列数; group与training具有相同的行数 返回:class:样品分类结果;err:误差 二、判别分析 二、判别分析 三、聚类分析 聚类分析的基本思想 我们所研究样品或指标之间存在程度不同的相似性(亲疏关系—以样品间的聚类衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或者指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较高的样品聚合为一类,把另外一些彼此之间相似程度较大的样品又聚合为另一类,直到把所有的样品聚合完毕。 三、聚类分析 2. 基本聚类分析法(最短距离法) 三、聚类分析 三、聚类分析 例1,设抽取五个样本,每个样品只测一个指标,它们是1,2,3.5,7,9,试用最短距离法对五个样品进行分类。 (1) 定义样品间距离采用绝对值距离|xi-xj|,得距离矩阵D(0) 三、聚类分析 三、聚类分析 三、聚类分析 三、聚类分析 3. 利用matlab进行聚类分析 三、聚类分析 三、聚类分析 例:我们对苏州所辖张家港市2003年七条河流中主要污染因子(指标)即CODmn, BOD5,非离子氨,氨氮,挥发酚,石油类共6个变量进行聚类分析. 三、聚类分析 三、聚类分析 三、聚类分析 上表为1999年中国省,自治区的城市规模结构特征的一些数据,可通过聚类分析将这些省、自治区进行分类。 三、聚类分析 四、主成分分析 1.降维思想 主成分分析是一种处理高维数据的方法,在实际问题的研究中,往往涉及众多有关的变量,但是变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般来说,虽然每个变量都提供了一定的信息,但其重要性不同,变量之间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以”改造“,用极少的互补相关的新变量来反映原变量所提供的绝大部分信息。 四、主成分分析 2.主成分分析的基本思想 主成分分析是采取以一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使得这些综合变量能尽可能代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法叫做主成分分析或主分量分析。 四、主成分分析 3.主成分分析计算步骤 四、主成分分析 四、主成分分析 四、主成分分析 四、主成分分析 四、主成分分析 四、主成分分析 四、主成分分析 四、主成分分析 四、典型相关分析 1.典型相关分析 通常情况下,为了研究两组变量之间的相关关系,应用十分广泛,例如 四、典型相关分析 2.基本原理 可以用最原始的方法,分别计算两组变量之间的全部相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,既可以使变量个数简化,又可以达到分析相关性的目的。 例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量: 分析两组变量之间的关系。 四、典型相关分析 四、典型相关分析 X=[…..];% 表中数据 例:我们对江苏省是个城市的生态环境状况进行了调查,得到相应的数据如下表 X1, X2, …, Xp Y1, Y2, …, Yq 1 小伙子追求姑娘的指标要求 ~~ 外貌, 身高

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档