基于主成分聚类分析的采矿方法优选.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于主成分聚类分析的采矿方法优选 0 算法的选择原则 在采矿和开采的设计中,采矿方法的选择起着重要作用,这对设计的其他环节有很大的影响。然而,要选择合理正确的采矿方法,需全盘考虑矿产地质条件、回采工艺特点等多种影响因素,在生产实践中多以传统的经验类比法为主,但该方法主观随意性较大,且在多方案优选时难以实现定量判断。 随着优化理论的发展,近年来出现了许多可用于采矿方法优选的数学方法,如模糊数学法、层次分析法、神经网络法、灰色理论等。然而,模糊数学法无法确定复杂指标体系的权重,且权重仅通过专家的主观评审选取,不够科学;层次分析法在因素分析时容易将“重要性”与“优越性”混淆,不能很好地反映各因素的实际贡献程度,通常需对比较矩阵进行一致性检验,计算过程较为复杂;神经网络法为改善网络的预测精度需要大量的学习样本进行训练,实现较为困难;灰色关联分析法则要求承载特征信息的历史数据具有一定的规律性,即适用条件有限制;灰色决策法会使决策值趋于均化,容易导致方案优选困难。因此,需继续寻找一种更为有效实用的方法。 考虑到采矿方法选择是一个涉及多因素、多层次、多指标的复杂决策系统工程,并且影响采矿方法选择的各项指标间存在一定的相关性,这势必增加分析问题的难度。主成分分析方法具有浓缩信息,简化指标结构等特点,能使分析问题的过程简单、直观、有效;聚类分析则能兼顾对象多因素的联系和主导作用,可按它们的亲疏差异程度逐步分组归类,更能客观地反映变量或区域之间的内在组合关系。基于这种思想,本文将主成分分析和聚类分析相结合,并用于实际矿山的采矿方法选择中,以期取得更好的效果。 1 主成分分析法 主成分分析法是将高维变量空间进行降维处理的一种方法。在保证原始数据信息丢失最少的前提下,经过线性变换和舍弃部分次要信息,以少数综合变量取代原有多维变量,使较少的综合指标既能尽量多地反映原始变量(指标)的主要信息,又能保证这些新产生的综合指标彼此间互不相关。遵循这一原则,该方法可避免信息重叠。传统主成分分析法的计算流程如图1所示。 传统主成分分析法通常采用Z-score法无量纲化,得到X′的计算公式为 但是,标准化在消除量纲或数量级影响的同时,也抹杀了各指标变异程度的差异信息。因此,笔者采用均值化处理方法加以改进,即包含了原始数据矩阵的全部信息。 在对提取的m个主成分F进行综合计算时,流行的方法是将每个主成分的贡献率作为各自的权重,然后构造出综合评价函数进行计算并将其排序。该方法看似合理,其实是一种误解,由此计算出的综合得分所含信息量并不会超过第一主成分所含信息量。但如果单凭第一主成分得分对样品评价,当其方差贡献率不大时,会有一定的片面性。针对以上情况,笔者将主成分分析与聚类分析相结合,即采用“主成分-聚类分析法”。 主成分-聚类分析法,即先做主成分分析,再取若干主成分对样品进行聚类分析,结合第一主成分排序对样品进行分类排名,由此得到一种新的综合评价方法。具体步骤如下。 (1)按照累计贡献率(一般为85%以上)选出前r个主成分,并计算主成分得分: (2)对所选定的新数据阵(Y1,Y2,…,Yr)进行系统聚类分析; (3)计算各类中样品第一主成分的平均值确定类间的排序; (4)根据类中样品第一主成分得分,确定各类中样品的排序,得到综合评价。 2 使用示例 2.1 某矿开采条件及技术经济指标、采矿方法统计数据 引用陈建宏、刘浪等的指标体系及数据,并在此基础上,通过均值化改进了主成分分析的特征提取,经处理后的某矿开采条件及技术经济指标、采矿方法统计数据见表1。表中各试样的采矿方法目前在某矿山中均处在试行阶段,但在此阶段,一些试样的采矿方法的实施效果并不佳,相继给矿山带来了不少安全隐患和经济财产损失等不良效应,因此有待通过本文的研究对各试样的采矿方法进行优选。 2.2 相关系数矩阵 借助专业统计软件SPSS 16.0对上述数据矩阵进行相关性分析,由于变量Xi(i=1,2,…,11)服从正态分布,故采用Pearson相关模型,相关系数的计算公式为 显著性检验采用two-tailed,即双尾T检验。经计算得出的相关系数矩阵见表2。由表2可知,有几个因素彼此间有较明显的相关性,因此需要对这些数据进行主成分分析。 2.3 保留因子的确定 根据主成分分析的原理,各主成分所提供的信息量多少,常用其方差的大小(即特征根λi)来衡量。通过对数据进行主成分分析,可得到主成分分析碎石图、特征值及主成分方差贡献率和累计贡献率、主成分因子荷载矩阵等输出结果,分别见图2、表3、表4。 图2给出了各主成分的特征根分布情况,可以看出,第5个λ值是一个明显的折点,这暗示着选取的主成分数目应有r≤5较为合适。再由表3可知,第一主成分的贡献率仅32.945%,综合性不强,但前5个主成分方差累计贡献率达到了85%以上,

文档评论(0)

139****9425 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档