- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1-数据描述
地质数据处理与计算机成图 一、地质变量和地质数据 地质变量: 在地学研究中,把随时间或空间位置不同,其取值也不同的量,称为地质变量。它是地学研究对象中能够观测到的某种地学特征。 很多地质变量都可以看作是随机变量。 随机变量根据其取值的情况,分为两类: 离散型随机变量: 只能取有限多个或可列无穷多个值的随机变量 连续型随机变量。 可以取一切实数值或某一区间的一切值的随机变量。 数据和信息: 数据是事实、概念或指令的形式化表示,是用于表示客观事物的未经加工的原始素材,如图像符号、数字、字母等。 信息是人们根据数据表现形式中所用的约定而赋予数据的意义。 两者关系表现为: (1)数据是现实世界的信息载体,是信息的具体表现形式。信息是数据的内涵,是形与质的关系。 (2)数据只有对实体行为产生影响时才成为信息;数据只有经过解释才有意义,成为信息。 地质数据: 地质数据是地质变量的观测值。 地质数据具有数据来源丰富、数据量庞大、数据结构复杂、分辨率多种、主题多样、格式多样等特点。 地学中常见的数据类型: (1)地形数据 (2)地质构造数据 (3)地球化学数据 (4)地球物理数据 (5)矿床数据 (6)岩石学数据 (7)地层古生物数据 二、地质数据的种类与特点 数据按测量精度可以分为名义型数据、有序型数据、间型隔数据、比例型数据。 1、名义数据(Nominal)。是一种测量精度最低、最粗略的基于“质”因素的变量,它的取值只代表观测对象的不同类别。如红色-1;灰色-2;白色-3 特点:无量的概念,只起标识或代码的作用,但同类数据可以通过‘计数’来赋予数量的概念。 唯一适合于名义型数据的数学关系是“等价关系” 最常用统计量是频数、比率或百分比等 2、有序型数据(Ordinal):它取值的大小能够表示观测对象的某种顺序关系(等级或大小等),可以排列成一个有序数列。如摩氏矿物硬度计:石英(硬度7)比长石(硬度6)高,金刚石(10)比刚玉(9)高。 特点:这类数据,它们之间并没有一种比例关系。不同等级间的级差,在绝对数量方面是不等的,即级差是不等的。 适合于有序型数据的数学关系是“大于()”和“小于()”关系。 最适合有序型数据取值的统计量是中位数。 3、间隔型数据(Interval):它的取值之间可以比较大小。间隔型数据是一些真实的数据,具有公共的、不变的测定单位,可以进行加减乘除运算。 特点:彼此间不仅能比较大小,而且可以定量表示这种差异。相等的间隔其长度也相等。没有自然0值。 4、比例型数据(Ratio):它与间隔型数据意义相近,差别在于间隔型数据中的“0”值只表示某一取值,不表示“没有”,而比例型数据的“0”值表示“没有”。是有绝对0值的间隔型数据。 温度—0℃ (间隔型变量) 岩层厚度—0M (比例型变量) 特点:不仅可以算出两数值的差,而且可以算出相差的倍数。 地质数据的其他分类法: 从数据应用的角度,可将地质数据分为原始数据和方法数据。 从地球科学各学科的角度,可分为地质数据、物探数据、化探数据、遥感数据等。 从信息统计的角度,可分为数值数据和文献数据。 从数学定量方法的角度,可分为纯量、向量、定和、坐标数据。 从统计学的角度,可分为定性数据和定量数据。 名义型数据和有序型数据为定性数据,而间隔型数据和比例型数据为定量数据。 定性数据一般都是离散型变量,而定量数据则主要为连续型变量。 由于概率统计方法主要是建立在变量正态分布的基础上,因此定量数据可以用各种统计方法进行处理。 三、地学数据统计特征分析 数据分布位置 数据分布离散度 数据分布形态 1、数据分布位置(Location) 位置是指数据分布的中心的位置以及其它部分的位置。 平均值: 算术平均数(Mean)表示的是某变量所有取值的集中趋势或平均水平。可以代表分布中心位置。 若一组数据x1, x2,......xn,代表一个大小为n的有限样本,则其样本平均数为: 加权平均值: 其中pi为权系数。其值的大小反映了xi在参与平均时的重要性大小。 几何平均值: 中位数(Median)给出了累积概率分布的50%的位置。把一组数据按递增或递减的顺序排列,处于中间位置上的变量就是中位数。因此当数据递增排列时,有50%的数据位于中位数之上,50%的数据位于中位数之下。中位数从另外一个角度给出数据的中心位置。 其计算方法为:一个大小为N的数列,求其中位数,首先应把该数列按大
文档评论(0)