- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
矿床统计预测地学数据
2 地质数据及其统计分布特征 2.1 地质数据 数据是对客观对象进行观测的记录,是有意义的符号组合,是各种分析方法所操作的对象。 数据是信息的载体;信息是数据的含义,是数据中包含的知识。 地质数据是通过对地质体、地质现象或地质作用过程进行观测、研究而得到的数据。 ? ? ? ? ? 遥感 定量数据 逻辑数据 文本数据 图形数据 图像数据 地质、矿产调查、勘查 ? ? ? ? ? 物探 ? ? ? ? ? 化探 ? ? ? ? ? 综合研究 ? ? ? ? ? 来源 表现形式 按照其表现形式及获取手段(来源),地质数据主要有以下种类。 2 地质数据及其统计分布特征 2.1 地质数据 这些数据有时统称为“地物化遥数据” 。 2.1 地质数据 定量数据,是指能够提供量的信息、能够互相比较大小、能够进行算术运算的数据。“半定量数据”是指精度或可靠性低到影响其计算的定量数据。 2 地质数据及其统计分布特征 逻辑数据,是指能够提供“是、否”或“真、假”这样的逻辑信息的数据。逻辑数据一般只需要两个不同的符号1和0,分别表示“是”和“否”;有时需要三个符号-1,0,1。表示三种逻辑状态。对逻辑数据可以进行逻辑运算。 文本数据,是代表事物的名称、编号或其它有标识、描述作用的文字或数字符号。一般不能进行算术运算或逻辑运算,但可能用于 “计数”,也可能用于排列顺序。 2.1 地质数据 图形数据,是指用一系列空间坐标来表示的、能提供关于点、线、面或体对象位置、形状、尺寸、空间关系等信息的数据。(在GIS领域,也称矢量数据)。 图像数据,如一张照片,是由某种定量或定性的属性值充满一个二维(或三维)空间而形成的数据,一般能够提供客观对象的位置、形状、尺寸、空间关系等信息。(在GIS领域也称栅格数据。) 针对各种数据,都可以研究数据的统计分布特征。 2 地质数据及其统计分布特征 逻辑数据和文本数据有时统称“定性数据”。 2.2 统计分布及其分析方法 在统计学及矿床统计预测中,数据常被看作是随机试验的结果,即对随机变量的抽样观测结果。数据的统计分布,又称经验分布,对应于随机变量的概率分布。随机变量的概率分布函数和概率密度反映该变量取不同值的概率。相应地,数据的统计分布反映一批数据出现不同值的频率。 一个随机变量可能取值的全体称为一个总体或母体;对随机变量进行有限次观测得到的数据集合称为一个样本。一次观测结果称为一个样品。 2 地质数据及其统计分布特征 可以通过以下途径研究一组数据的统计分布: (1)计算统计特征值 2.2 统计分布及其分析方法 平均值: 方差: 标准差: 变异系数: 以上各式中, 表示数据,n为数据个数。 Eq 2-1 Eq 2-2 Eq 2-3 Eq 2-4 众数也较常用,是指出现频率最高的数值或数值区间。 2 地质数据及其统计分布特征 (2)作频率分布直方图和/或累计频率分布直方图。直方图能直观反映数据的频率分布情况。 2.2 统计分布及其分析方法 1)将一组数据的值的范围分为多个区间(一般为等长区间); 2)统计每个区间内数据的个数,称频数; 3)频数除以数据总个数,得到各区间的频率。 4)以数据的值为横坐标,以频率(或频数)为纵坐标,对应于每个区间画一矩形,其宽度为区间宽度,高度表示频率(数)值。 各区间频率值由小到大顺序累加可以得到累计频率曲线。 作直方图的方法(复习): 2 地质数据及其统计分布特征 2.2 统计分布及其分析方法 3)对直方图,有时可用某种概率分布模型进行拟合。通过拟合,可以进行某些推断或估计。比如, 右图是某地区区域化探数据中Mn含量的直方图,说明该元素含量接近于正态分布。 如能确认x服从正态分布,则可推断: 频数 Mn含量(ppm) 2 地质数据及其统计分布特征 的概率为68.26% x介于 x介于 概率为95.44% x介于 概率为99.74% 2.3 研究数据统计分布的意义 (1)不同成因的地质现象或地质体,观测数据往往表现出不同的统计分布特征。因此,统计分布特征是地质现象的重要数学特征之一,往往有一定的鉴别和成因意义。 (2)查明统计分布特征,常是对数据做进一步分析的基础。比如有些方法要求数据服从某种特定的分布才能使用。若数据不符合这种要求,就要进行必要的变换。 (3)如前述,根据数据的统计分布特征,选择合适的概率分布模型进行拟合,就可以进行必要的统计推断或估计。 2 地质数据及其统计分布特征 平均数(或称数学期望) ,表征分布的集中性; 2.4 几种重要的概率分布模型 (1)正态分布(高斯分布):是连续型随机变量的一种最常见最重要的概率分布模型。 概率密度: 分布函数: 正态分布有两个参数: 标准差 ,表征分布的分散性(即相对于 的偏离程度)。 Eq 2-5 Eq 2-6 2 地
文档评论(0)