- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于稳健性的非正态数据转换方法研究
地质统计学作为数学地质领域的一门学科,发展迅速,具有广阔的应用前景。它在异常评估、环境研究、矿床勘探、煤矿划定、储量计算、采矿设计、采矿生产和地质勘探等方面具有明显的优势。通常,基于不同的数据分布类型采用不同的网格方法。其基本前提是,区域变量的空间分布必须满足相对应的假设(或内部)假设,其内容是:如果实际区域变量的空间分布偏离给定假设,分布较大时,使用一种估算方法可以获得更令人满意的结果。换句话说,假设最小的偏差率,即限制下的最小散射偏差。
影响克立格估计方差(克里格法估计误差的方差)的因素除了区域化变量的偏差分布外,还有特异值、变异函数、块体大小和估值搜索参数选择等很多因素,在此仅从区域化变量分布的稳健性着手.
目前,克立格法因其分布的稳健性问题而衍生了对数正态克立格法、指示克立格法等多种估计方法. 在实践中,不管采用何种方法,分布假设一般很难得到满足. 因此,如何解决区域化变量的分布问题,以减小估计误差、提高估计精度和克立格估计的稳健性,是本文研究的问题.
由于正态分布是应用最为广泛的一种随机分布,因此许多学者和工程师纷纷提出将非正态数据转变成正态数据. 本文在对几种常见的数据转换方法进行简要分析的基础上,借鉴产品加工质量精度控制的方法,引入了一套非正态数据转换方法,并以SPSS和矿业软件为工具,通过实际案例研究验证了该方法在矿业领域进行数据转换的有效性和实用性.
1 直接数据转换算法
非正态分布的原始数据转化为正态或近似正态分布的变换,目前相对有效的主要有两类方法:一是直接数据转换方法,该方法通过各种数据转换函数将非正态数据转变为正态;二是曲线拟合转换方法,该方法主要利用Pearson曲线族和Johnson分布曲线族对实际数据的频率分布进行拟合.
1.1 矿物微量元素含量n或反余弦系参数转换
目前常用的主要方法是把原始数据的第i样品对应变量设为xi,转换后的对应值设为yi.
(1) 平方根转换yi=√xi+cyi=xi+c?????√,主要用于具有泊松分布的离散型分布;
(2) 倒数转换yi=1/xi,或进行组合变化,平方根后取倒数yi=1/√xiyi=1/xi??√;
(3) 平方根后再取反正弦yi=arcsin(√xi/10n)yi=arcsin(xi/10n??????√)(右偏)或反余弦yi=arccos(√xi/10n)cos(xi/10n??????√)(左偏);
(4) 幂转换yi=xλi-1λˉxλ-1yi=xλi?1λxˉλ?1,其中ˉxxˉ为变量xi均值,参数λ∈[-1.5,1.0];
(5) 三参数对数正态转换yi=ln(xi-c)(c=x2m0-xminxmax2xm0-xmin-xmax,m0yi=ln(xi?c)(c=x2m0?xminxmax2xm0?xmin?xmax,m0为中位数,xmin为大于0的最小值,xmax为比样品中最大值更大的值;或者,c=x2m0-f1f22xm0-f1-f2?f1和f2为对应于累加概率p和1-p的取样值,p取5%与20%之间的值. 若为右偏,采用yi=ln(c-xi)),大多数内生有色、稀有及贵金属矿床中的有用组分,以及岩石矿石中微量元素,均具有对数正态分布特征.
上述几种数据转换方式的实质是通过对数据分布的峰度和偏度进行调整,使其逼近正态性. 因此只有当数据分布接近正态时,才有可能顺利实现;当数据分布特征不明显,或呈现其他随机分布特征时,数据转换效果不明显.
1.2 选择合适的表面活性剂的方法
这种估计方法主要是利用Pearson曲线族和Johnson分布曲线族对非正态数据分布进行拟合. 两种曲线族都覆盖了一个范围很广的分布,其实质也是一类函数转换方法.
应用Pearson曲线族拟合非正态分布主要出现在早期的研究中,大多根据Pearson分位表来计算分位数,尽管计算上比较简单,但只提供了在有限的偏度和峰度范围内的百分位数估计值,而且难以获得任何关于拟合良好性的信息.
Johnson提出了关于随机变量的三个分布曲线族,都可以很容易地转化为标准正态分布. 这些分布分别表示为SB、SL和SU三种转换类型,三种类型的参数约束及变量取值范围如表1所示. Nicholas利用约翰逊曲线对非正态数据进行拟合,不仅能描述Pearson系统各类曲线的通用范围,而且计算过程比Pearson更简便可靠. 因此,本文直接采用Johnson曲线族用于研究.
针对一个具体的非正态数据应用场合,如何根据样本选择合适的Johnson曲线类型是首要的问题,其步骤如下.
选择一个合适的z,通过标准正态表找出对应于{-sz,-z,z,sz}的分布概率{p-sz,p-z,pz,p-sz},并在实际样本数据中找出上述分布概率所对应分位数{x-sz,x-z,xz
原创力文档


文档评论(0)