(数据统计模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(数据统计模型

数据统计模型 多变量统计分析主要用于数据分类和综合评价。综合评价是区划和规划的基础。从人类认识的角度来看有精确的和模糊的两种类型,因为绝大多数地理现象难以用精确的定量关系划分和表示,因此模糊的模型更为实用,结果也往往更接近实际,模糊评价一般经过四个过程: ??? (1)评价因子的选择与简化; ??? (2)多因子重要性指标(权重)的确定; ??? (3)因子内各类别对评价目标的隶属度确定; ??? (4)选用某种方法进行多因子综合。 主成分分析 地理问题往往涉及大量相互关联的自然和社会要素,众多的要素常常给模型的构造带来很大困难,为使用户易于理解和解决现有存储容量不足的问题,有必要减少某些数据而保留最必要的信息。 主成分分析 是通过数理统计分析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析,构造应用模型。 设有n个样本,p个变量。将原始数据转换成一组新的特征值——主成分,主成分是原变量的线性组合且具有正交特征。即将x1,x2,…,xp综合成m(m<p)个指标zl,z2,…,zm,即 ????????????????? z1=l11*x1+l12*x2+...+l1p*xp ????????????????? z2=l21*x1+l22*x2+...+l2p*xp ????????????????? .................. ????????????????? zm=lm1*x1+lm2*x2+...+lmp*xp 这样决定的综合指标z1,z2,…,zm分别称做原指标的第一,第二,…,第m主成分,且z1,z2,…,zm 在总方差中占的比例依次递减。而实际工作中常挑选前几个方差比例最大的主成分,从而简化指标间的关系,抓住了主要矛盾。 从几何上看,找主成分的问题,就是找多维空间中椭球体的主轴问题,从数学上容易得到它们是x1,x2,…,xp的相关矩阵中m个较大特征值所对应的特征向量,通常用雅可比(Jaobi)法计算特征值和特征向量。 主成分分析这一数据分析技术是把数据减少到易于管理的程度,也是将复杂数据变成简单类别便于存储和管理的有力工具。地理研究和生态研究的GIS用户常使用上述技术,因而应把这些变换函数作为GIS的组成部分。 层次分析法(AHP) Hierarahy Analysis 是T.L.Saaty等在70年代提出和广泛应用的,是系统分析的数学工具之一,它把人的思维过程层次化、数量化,并用数学方法为分析、决策、预报或控制提供定量的依据。 AHP方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各因素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性权值,作为综合分析的基础。例如要比较n个因素y={yl,y2,…,yn }对目标Z的影响,确定它们在z中的比重,每次取两个因素yi和yJ,用aij表示yi与yJ对Z的影响之比,全部比较结果可用矩阵A=(aij)n*n表示,A叫成对比矩阵,它应满足: ???????????????????? aij0,aij=1/aij?? (i,j=1,2,...n) 使上式成立的矩阵称互反阵,必有aij=l。 在旅游问题中,假设某人考虑5个因素:费用yl、景色y2,居住条件y3,饮食条件y4、旅途条件y5。他用成对比较法得到的正互反阵是: ??????????????? 在上式中a12=2表示yl与景色y2对选择旅游点(目标Z)的重要性之比为2:1;a13=7,表示费用yl与居住条件y3之比为7:1;a23=4,则表示景色y2与居住条件y3之比为4:1。如果A不是一致阵(即A12、A23;不等于A13;),需求正互友阵最大特征值对应的特征向量,作为权向量。 系统聚类分析 60年代末到70年代初人们把大量精力集中于发展和应用数字分类法,且将这类方法应用于自然资源、土壤剖面、气候分类、环境生态等数据,形成“数字分类学”学科。目前聚类分析已成为标准的分类技术,在许多大型计算机中都存储了这种分析程序,从GIS数据库中将点数据传送到聚类分析程序也不困难。 聚类分析的主要依据是把相似的样本归为一类,而把差异大的样本区分开来。在由m个变量组成为m维的空间中可以用多种方法定义样本之间的相似性和差异性统计量。 例:用xik表示第i个样本第k个指标的数据xik表示第j个样本第k个指标数据;dij表示第i个样本和第j个样本之间的距离,根据不同的需要,距离可以定义为许多类型,最常见、最直观的距离是欧几里德距离,其定义如下:? ??????????????????? 依次求出任何两个点的距离系数dij(i,j=l,2,

文档评论(0)

lisuf331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档