网站大量收购独家精品文档,联系QQ:2885784924

多元统计分析与软件应用-1.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 多元统计分析起源于上世纪初,1928年Wishart发表论文《多元正态总体样本协差阵的精确分布》,可以说是多元分析的开端。 20世纪30年代R.A. Fisher 、H.Hotelling、S.N.Roy、许宝騄等人作了一系列得奠基性工作,使多元分析在理论上得到了迅速得发展。 20世纪40年代在心理、教育、生物等方面有不少得应用,但由于计算量大,使其发展受到影响,甚至停滞了相当长得时间。 20世纪50年代中期,随着电子计算机得出现和发展,使多元分析方法在地质、气象、医学、社会学等方面得到广泛得应用。 20世纪60年代通过应用和实践又完善和发展了理论,由于新的理论、新的方法不断涌现又促使它的应用范围更加扩大。 20世纪70年代初期在我国才受到各个领域的极大关注,并在多元统计分析的理论研究和应用上也取得了很多显著成绩,有些研究工作已达到国际水平,并已形成一支科技队伍,活跃在各条战线上。 * 在20世纪末与本世纪初,人们获得的数据正以前所未有的速度急剧增加,产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学以及政府统计等领域,多元统计与人工智能和数据库技术相结合,已在经济、商业、金融、天文等行业得到了成功的应用。 * 多元统计包括方差分析、回归分析、判别分析、聚类分析、因子分析、对应分 析、典型相关分析等。 判别分析和聚类分析用于数据的分类,因子分析(含主成分分析)、对应分析主要用于数据结构的简化(例如变量变换和降低空间维数),典型相关分析则用于两组变量间相关性。 多元统计 4.地质统计学 地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性,又有结构性的自然现象的科学 。 地质统计学(Geostatistics)包含经典统计学与空间统计学 4.地质统计学 地质统计学的历史发展 在南非矿山工程师克里格(克里金)(D·G·Krige)等人工作的基础上,由法国的马特隆(G·Matheron l962)创立并发展起来的一门具有完整理论体系的数理统计中的一个新的分支学科。 1951年,克立格(Daniel Krige)提出一个论点:“可以预计,一个矿山总体中的金品位的相对变化要大于该矿山某一部分中的金品位的相对变化”。换句话说,以较近距离采集的样品很可能比以较远距离采集的样品具有更近似的品位。这一论点是描述在多维空间内定义的数值特征的空间统计学据以建立的基础。 * 到上世纪60年代:把样品值之间的相似性作为样品间距离的函数来加以模拟,并且得出了半变异函数。 法国概率统计学家马特隆(Matheron)创立了一个理论框架,为克立格作出的经验论点提供了精确而简明的数学阐释。马特隆创造了一个新名词“克立格法”(Kriging),藉以表彰克立格在矿床的地质统计学评价工作中所起到的先驱作用,提出了区域化变量(Regionalized variable)的概念和地质统计学(Geostatistics)一词,发表了《应用地质统计学》,该著作的出版标志着地质统计学作为一门新兴边缘学科而诞生。 在法国枫丹白露成立了地质统计学中心(Centre de Geostatistiques),培养了一大批学员,不仅为地质统计学的研究而且为它的传播起到了巨大的作用。 5.稳健统计学 问题的提出: 经典的统计方法大多以正态分布假设及最小二乘法为基础,可是在实际数据中特别是地质数据(如油气化探数据)中的离散度大,偏离正态分布假设的情况十分普遍。 a.总体服从正态分布,由于各类误差(随机误差、系统误差、过失误差)或外总体的加入所致; b.总体本来就不服从正态分布,如服从t分布、F分布等; 偏离的原因 后果: 当数据偏离正态假设较明显时,经典的统计方法常常给出不容易觉察的歪曲的甚至错误的结果。可见经典统计学方法对偏离正态分布假设的情况是非常敏感的。博克斯(G·E·P·Box,1953)把这种现象称之为稳健性问题。这就是稳健性一词的由来。 改进方法: 修改统计方法使之更稳健,以适应数据偏离统计假设的情况,是稳健统计学产生和发展的一个主导思想。各种稳健统计方法的基础是对位置(即数据点群的中心)及尺度(即数据点群的离散度)的稳健估计。 例如 采用中位数及中位绝对中位差,即MAD=med{[xi一med(xi)]}/0.6746来代替算术平均值及标准差作为数据平均值及离散度的估计值,可以获得较好的稳健性。目前已提出了M估计(最大似然估计)、L估计(有序统计量的线性组合)及R估计(秩估计)。 稳健统计方法的特点: ①数据满足统计假设时,方法性能良好,给不出最佳结果,此时只有经典统计学方法才是最优方法; ②数据轻微偏离统计假设时方法性能

文档评论(0)

wxc6688 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档