实用多元统计分析——ynh.docVIP

下载本文档

74
0
约5.81千字
约 17页
2017-01-09 发布于重庆
举报
版权申诉

实用多元统计分析——ynh.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

实用多元统计分析——ynh

中国地质大学研究生课程论文封面课程名称实用多元统计分析教师姓名研究生姓名研究生学号研究生专业石油与天然气工程所在院系资源学院类　　　别硕士日　　　期 2013 年12月19日一．聚类分析聚类分析是根据“物以类聚”的道理，对样品或指标进行分类的一种方法，它们讨论的对象是大量的样品，要求能合理地按各自的特性来进行合理的分类，没有任何模式可供参考或依循，即是在没有先验知识的情况下进行的。井号层位相对分选系数汞孔隙度饱和度中值压力平均孔隙半径结构系数最大排驱压力孔隙度最大汞饱和度 Ek1 0.92 10.74 5.01 7.16 1045.50 0.12 15.00 71.61 2 Es3 1.35 15.04 4.31 7.95 198.41 0.16 23.05 65.25 3 Ek2 1.33 6.62 9.24 8.91 988.10 0.27 10.26 64.53 3 Ek2 0.90 10.97 1.40 9.46 257.39 0.23 14.73 74.65 4 ME 1.07 7.99 10.33 7.98 179.61 4.21 12.02 66.51 5 Ek3 1.24 10.71 2.37 8.39 1304.80 0.17 15.86 67.52 6 ES1 0.94 15.60 0.27 17.70 16.64 0.01 19.42 80.34 7 MZ 1.26 9.57 6.16 6.90 392.55 0.22 14.53 65.90 8 K-J 0.25 15.15 10.92 4.81 356.23 0.06 23.66 64.03 2.聚类分析方法按照聚类过程以及所使用的算法，可以将聚类分析分为快速聚类和系统聚类法（分层聚类）。快速聚类主要是大规模的样品进行有效的聚类。分层聚类既可以对样品进行聚类，又可以对指标进行聚类。本次作业分别利用两种方法来对表1所示的数2：初始类中心表3：聚类结果表表4：迭代过程中凝聚点（聚类中心）变化值结果表表5：最终凝聚点（聚类中心）表6：最终聚类中心距离表8：各类所含的样品数：：：表7：各聚类变量的方差分析结果 3.1.2快速聚类方法过程及分析由输出结果可以得到以下结论： 1．确定凝聚点：因为凝聚点的选择采用了系统默认的方式，所以系统将枣74张海2-2王26-1 类似可得第二类和第三类之间的距离。则挑选一个较小距离，然后乘以0.01则得收敛标准（具体计算过程略）。 3．如表3所示，对样本的聚类结果将4.、8、9分为一类；将2、5、7分为一类；将1、3、6分为一类； 4．如表4所示，每次聚类都要计算凝聚点的变化，这组数据凝聚点变化值为：57.34、115.643、192.044；最终凝聚点则如表5所示。 5．表6为最终聚类中心距离，第一类与第二类的中心距离为203.905；第一类与第三类的中心距离为777.425；第二类与第三类的中心距离为981.273； 6．表8所示为每类样品所包含的样品数。 3.2系统聚类法（分层聚类法）基本思想：先将待聚类的n类样品（或变量）各自看成一类，共n类，然后按选定的方法计算每两类之间的聚类统计量，将关系最密切的两类聚为一类，即有n-1类，在按前面的方法计算新类与其它类之间距离（或相似系数），在将关系密切的两类聚为一类，有n-2类，如此继续，每次重复都减少一类，直到所有样品（或变量）聚为一类 3.2.1聚类结果表9：参与聚类分析的样品概述表10：样品间的距离矩阵表11：聚类步骤表表12：聚类结果表 3.2.3系统聚类方法过程及分析由输出结果得到以下结论： 1．从表9聚类分析样品的概述中可以看出，参与聚类分析的有效样品的变量数为9个，占所有样品100％；参与聚类分析的有效样品的变量所含有缺失值的样品数为0个，占所有样品的0％；参与聚类分析的总样品的变量数