- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用多元统计分析——ynh
中 国 地 质 大 学
研究生课程论文封面
课程名称 实用多元统计分析
教师姓名
研究生姓名
研究生学号
研究生专业 石油与天然气工程
所在院系 资源学院
类 别 硕士
日 期 2013 年12月19日
一.聚类分析
聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。井号 层位 相对
分选
系数 汞孔隙度 饱和度
中值压力 平均
孔隙半径 结构
系数 最大
排驱
压力 孔隙度 最大
汞饱和度 Ek1 0.92 10.74 5.01 7.16 1045.50 0.12 15.00 71.61 2 Es3 1.35 15.04 4.31 7.95 198.41 0.16 23.05 65.25 3 Ek2 1.33 6.62 9.24 8.91 988.10 0.27 10.26 64.53 3 Ek2 0.90 10.97 1.40 9.46 257.39 0.23 14.73 74.65 4 ME 1.07 7.99 10.33 7.98 179.61 4.21 12.02 66.51 5 Ek3 1.24 10.71 2.37 8.39 1304.80 0.17 15.86 67.52 6 ES1 0.94 15.60 0.27 17.70 16.64 0.01 19.42 80.34 7 MZ 1.26 9.57 6.16 6.90 392.55 0.22 14.53 65.90 8 K-J 0.25 15.15 10.92 4.81 356.23 0.06 23.66 64.03 2.聚类分析方法
按照聚类过程以及所使用的算法,可以将聚类分析分为快速聚类和系统聚类法(分层聚类)。快速聚类主要是大规模的样品进行有效的聚类。分层聚类既可以对样品进行聚类,又可以对指标进行聚类。本次作业分别利用两种方法来对表1所示的数2:初始类中心 表3:聚类结果表
表4:迭代过程中凝聚点(聚类中心)变化值结果表 表5:最终凝聚点(聚类中心)
表6:最终聚类中心距离 表8:各类所含的样品数
:::
表7:各聚类变量的方差分析结果
3.1.2快速聚类方法过程及分析
由输出结果可以得到以下结论:
1.确定凝聚点:因为凝聚点的选择采用了系统默认的方式,所以系统将枣74张海2-2王26-1 类似可得第二类和第三类之间的距离。则挑选一个较小距离,然后乘以0.01则得收敛标准(具体计算过程略)。
3.如表3所示,对样本的聚类结果将4.、8、9分为一类;将2、5、7分为一类;将1、3、6分为一类;
4.如表4所示,每次聚类都要计算凝聚点的变化,这组数据凝聚点变化值为:57.34、115.643、192.044;最终凝聚点则如表5所示。
5.表6为最终聚类中心距离,第一类与第二类的中心距离为203.905;第一类与第三类的中心距离为777.425;第二类与第三类的中心距离为981.273;
6.表8所示为每类样品所包含的样品数。
3.2系统聚类法(分层聚类法)
基本思想:先将待聚类的n类样品(或变量)各自看成一类,共n类,然后按选定的方法计算每两类之间的聚类统计量,将关系最密切的两类聚为一类,即有n-1类,在按前面的方法计算新类与其它类之间距离(或相似系数),在将关系密切的两类聚为一类,有n-2类,如此继续,每次重复都减少一类,直到所有样品(或变量)聚为一类
3.2.1聚类结果
表9:参与聚类分析的样品概述
表10:样品间的距离矩阵
表11:聚类步骤表
表12:聚类结果表
3.2.3系统聚类方法过程及分析
由输出结果得到以下结论:
1.从表9聚类分析样品的概述中可以看出,参与聚类分析的有效样品的变量数为9个,占所有样品100%;参与聚类分析的有效样品的变量所含有缺失值的样品数为0个,占所有样品的0%;参与聚类分析的总样品的变量数
文档评论(0)