实用多元统计分析——ynh.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用多元统计分析——ynh

中 国 地 质 大 学 研究生课程论文封面 课程名称 实用多元统计分析 教师姓名 研究生姓名 研究生学号 研究生专业 石油与天然气工程 所在院系 资源学院 类   别 硕士 日   期 2013 年12月19日 一.聚类分析 聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。井号 层位 相对 分选 系数 汞孔隙度 饱和度 中值压力 平均 孔隙半径 结构 系数 最大 排驱 压力 孔隙度 最大 汞饱和度 Ek1 0.92 10.74 5.01 7.16 1045.50 0.12 15.00 71.61 2 Es3 1.35 15.04 4.31 7.95 198.41 0.16 23.05 65.25 3 Ek2 1.33 6.62 9.24 8.91 988.10 0.27 10.26 64.53 3 Ek2 0.90 10.97 1.40 9.46 257.39 0.23 14.73 74.65 4 ME 1.07 7.99 10.33 7.98 179.61 4.21 12.02 66.51 5 Ek3 1.24 10.71 2.37 8.39 1304.80 0.17 15.86 67.52 6 ES1 0.94 15.60 0.27 17.70 16.64 0.01 19.42 80.34 7 MZ 1.26 9.57 6.16 6.90 392.55 0.22 14.53 65.90 8 K-J 0.25 15.15 10.92 4.81 356.23 0.06 23.66 64.03 2.聚类分析方法 按照聚类过程以及所使用的算法,可以将聚类分析分为快速聚类和系统聚类法(分层聚类)。快速聚类主要是大规模的样品进行有效的聚类。分层聚类既可以对样品进行聚类,又可以对指标进行聚类。本次作业分别利用两种方法来对表1所示的数2:初始类中心 表3:聚类结果表 表4:迭代过程中凝聚点(聚类中心)变化值结果表 表5:最终凝聚点(聚类中心) 表6:最终聚类中心距离 表8:各类所含的样品数 ::: 表7:各聚类变量的方差分析结果 3.1.2快速聚类方法过程及分析 由输出结果可以得到以下结论: 1.确定凝聚点:因为凝聚点的选择采用了系统默认的方式,所以系统将枣74张海2-2王26-1 类似可得第二类和第三类之间的距离。则挑选一个较小距离,然后乘以0.01则得收敛标准(具体计算过程略)。 3.如表3所示,对样本的聚类结果将4.、8、9分为一类;将2、5、7分为一类;将1、3、6分为一类; 4.如表4所示,每次聚类都要计算凝聚点的变化,这组数据凝聚点变化值为:57.34、115.643、192.044;最终凝聚点则如表5所示。 5.表6为最终聚类中心距离,第一类与第二类的中心距离为203.905;第一类与第三类的中心距离为777.425;第二类与第三类的中心距离为981.273; 6.表8所示为每类样品所包含的样品数。 3.2系统聚类法(分层聚类法) 基本思想:先将待聚类的n类样品(或变量)各自看成一类,共n类,然后按选定的方法计算每两类之间的聚类统计量,将关系最密切的两类聚为一类,即有n-1类,在按前面的方法计算新类与其它类之间距离(或相似系数),在将关系密切的两类聚为一类,有n-2类,如此继续,每次重复都减少一类,直到所有样品(或变量)聚为一类 3.2.1聚类结果 表9:参与聚类分析的样品概述 表10:样品间的距离矩阵 表11:聚类步骤表 表12:聚类结果表 3.2.3系统聚类方法过程及分析 由输出结果得到以下结论: 1.从表9聚类分析样品的概述中可以看出,参与聚类分析的有效样品的变量数为9个,占所有样品100%;参与聚类分析的有效样品的变量所含有缺失值的样品数为0个,占所有样品的0%;参与聚类分析的总样品的变量数

文档评论(0)

wuyuetian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档