- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数学地质》2讲2地质数据与其统计分析
第二课 地质数据及其统计分析
讲5个方面的问题
一、地质数据的概念、类型及属性
二、地质数据的选择和整理
三、地质数据的预处理
四、地质数据的统计分布特征
五、与油气地质有关的分布函数
一、地质数据的概念、类型及属性
1 概念
地质信息的数、字母和符号的集合。
2 类型
按地质数据的特点分为观测、综合和经验数据三大类。
◆观测数据——对研究对象直接进行观测和度量所获得的数据。
又分为定性和定量数据。
= 1 \* GB3 ①定性数据——用代码或字符等来表示某一地质特征及其相互间关系的一种“数据”。
又分为名义型和有序型两种。
名义型数据 通过鉴别区分不同的对象或个体并赋予不同代码后形成的数据。如:岩石的颜色、结构、构造等。
有序型数据 有次序的数码或代码并用次序来表示数码或代码间的一种单调升降关系的数据。如:生油岩的干酪根分成 = 1 \* ROMAN I, = 2 \* ROMAN II, = 3 \* ROMAN III级。又如:油气储量的级别等。
= 2 \* GB3 ②定量数据——具有数量概念的数据。分为间隔型和比例型数据。
间隔型数据 特点:不仅能比较其大小,而且能定量地表示数据间的差异;无自然零值,但有负值。
比例型数据 特点:具有绝对零值而没有负值的间隔型数据。大多数定量数据都属比例型数据。
◆综合数据——由观测数据经有限次算术或代数运算后,并具有明确地质意义的数据。
如:甲烷系数、时间—温度指数值、平均值、均方差、相关系数等。
◆经验数据——根据大量实际观测值归纳出来或根据公式计算而得出的经验值。
如:单储系数、排烃系数等。
3 属性
统计规律性
随机变量的性质,一次观测具有偶然性,多次重复观测,则具有规律性。
函数规律性
当自变量给定,函数就完全确定了,如:原子核发生衰变时,即子元素数量公式为:
式中:——衰变开始时原子核的总数
——衰变时间 ——时间后母元素的数量 ——系数
二、地质数据的选择和整理
1 地质数据选择时应注意的问题
◆根据研究目的和要求选择数据
◆选择的数据反映指标的地质意义明确
◆数据的水平要一致,可靠性要强
◆能对数据的统计和函数规律性作出描述、
◆数量应能满足数学模型的要求
◆数据的分布均匀、合理
2 数据的处理
原始数据矩阵,即
方法数据矩阵
对原始数据矩阵按一定的方法进行变换,使其满足数学模型的要求,这种经变换后形成的数据矩阵称为方法数据矩阵。
如对数变换、正规化变换等。
3 结构数据模型
通常把表示实体及实体之间联系的模型叫做结构数据模型。结构数据模型包括:
层次模型——用树形结构来表示实体之间联系的模型。
网络模型——用丛结构来表示实体之间联系的模型。
关系模型——用表格数据表示实体之间联系的模型。
三、地质数据的预处理
1 可疑数据的鉴别和处理方法
肖维纳(chauvent)检验法
步骤:
计算观测数据的平均值
计算单次观测的概率误差
其中——标准差
计算可疑数据与平均值之偏差,并求其与的比值
根据所观测次数()以及其对应的之比值决定数据的取舍。如下表所示:
5
10
15
20
50
100
2.5
2.9
3.2
3.3
3.8
4.2
= 5 \* alphabetic e. 若,则舍去这一观测值。
格罗伯斯(grubps)检验法
前提:当按小到大排列且服从正态分布时,构建检验统计量: 式中:
当时,则为外来值,舍去其值。
2 数据的简缩均匀化、缺值插补和删点
(1)数据网络化方法
公式为:
式中:——第个网格内的网格化值。
——第个网格内某地质变量第个观测值。
——第个网格内的观测次数。
(2)缺值插补和删点
删点:随机删去一些点,保持数据分布均匀。
插值:数据平均值或统计方法进行插值。
3 数据变换
(1)目的和要求
目的:
统一地质变量的量纲
使地质变量呈正态分布
使变量间的非线性关系转换为线性关系
由一种新的独立变量代替原有相关关系的变量
要求:
变换前后变量间的相关程度不变
防止数据产生有偏估计,丢失信息
(2)数据变换方法
= 1 \* GB3 ①统一量纲的变换
a 标准化变换
公式
式中 (标准差)
性质: 变量的量纲一致。
服从正态分布,服从标准正态分布。
= 2 \* alphabetic b 极差变换
公式
性质 数据量纲一致
= 3 \* alphabetic c 均匀化变换
公式
性质 数据量纲一致,数据都在1附近变化。
= 2 \
您可能关注的文档
- 《酒店餐厅厨房管理草案》.doc
- 《酒店新员工培训草案》.doc
- 《酒店英语词汇集锦cover》.doc
- 《局域网管理员》实践试题.doc
- 《李子勋创新思维和营销心理学上》.doc
- 《劳动合同法》和人力资源管理.doc
- 《连锁·家电·餐饮绩效奖金与提成制度》.doc
- 《零售业100个创意促销草案》读书笔记.doc
- 《毛诗序》全文翻译与释义.doc
- 《孟子》全文与翻译.doc
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)