几种统计方法.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

判别分析(DiscriminatoryAnalysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。统计方法(回归分析)回归分析—对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法(一元线性回归、多元线性回归、非线性回归)回归分析在一组数据的基础上研究这样几个问题:建立因变量与自变量之间的回归模型(经验公式)对回归模型的可信度进行检验判断每个自变量对因变量的影响是否显著判断回归模型是否适合这组数据利用回归模型对进行预报或控制[b,bint,r,rint,stats]=regress(Y,X,alpha)(线性回归)rstool(x,y,’model’,alpha)(多元二项式回归)[beta,r,J]=nlinfit(x,y,’model’,beta0)(非线性回归)统计方法(逐步回归分析)逐步回归分析—从一个自变量开始,视自变量作用的显著程度,从大到小依次逐个引入回归方程当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步对于每一步都要进行检验,以确保每次引入新的显著性变量前回归方程中只包含作用显著的变量这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止stepwise(x,y,inmodel,alpha)SPSS,SAS统计方法(聚类分析)聚类分析—所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类系统聚类分析—将n个样本或者n个指标看成n类,一类包括一个样本或者指标,然后将性质最接近的两类合并成为一个新类,依此类推。最终可以按照需要来决定分多少类,每类有多少样本(指标)统计方法(系统聚类分析步骤)系统聚类方法步骤:计算n个样本两两之间的距离构成n个类,每类只包含一个样品合并距离最近的两类为一个新类计算新类与当前各类的距离(新类与当前类的距离等于当前类与组合类中包含的类的距离最小值),若类的个数等于1,转5,否则转3画聚类图决定类的个数和类。聚类分析系统聚类法是聚类分析中应用最为广泛的一种方法,它的基本原理是:首先将一定数量的样品或指标各自看成一类,然后根据样品(或指标)的亲疏程度,将亲疏程度最高的两类进行合并。然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直至将所有的样品(或指标)合并为一类。系统聚类分析用到的函数函数功能pdist计算观测量两两之间的距离squareform将距离矩阵从上三角形式转换为方形形式,或从方形形式转换为上三角形式linkage创建系统聚类树dendrogram输出冰柱图cophenet计算Cophenetic相关系数cluster根据linkage函数的输出创建分类clusterdata根据数据创建分类inconsistent计算聚类树的不连续系数统计方法(判别分析)判别分析—在已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。距离判别法—首先根据已知分类的数据,分别计算各类的重心,计算新个体到每类的距离,确定最短的距离(欧氏距离、马氏距离)Fisher判别法—利用已知类别个体的指标构造判别式(同类差别较小、不同类差别较大),按照判别式的值判断新个体的类别Bayes判别法—计算新给样品属于各总体的条件概率,比较概率的大小,然后将新样品判归为来自概率最大的总体判别分析判别分析是利用原有的分类信息,得到体现这种分类的函数关系式(称之为判别函数,一般是与分类相关的若干个指标的线性关系式),然后利用该函数去判断未知样品属于哪一类。对于给定的数据,用classify函数进行线性判别分析,用mahal函数计算马氏距离。判别分析因子分析因子分析是一种降维方法。需要用模型解释数据内部的相关性时,使用因子分析法进行分析。MATLAB中,用factoran函数进行因子分析。最近邻法线性插值三次插值用interpn函数进行更高维数据的插值,同样有最近邻插值、线性插值和三次插值三种方法。

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档