- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
海洋测量中海底高程异常数据的处理与分析
苗元欣
(山东省地质矿产勘查开发局第五地质大队,山东泰安,271000)
摘 要:海洋测量的主要任务是对海洋表面及海底的形状和性质参数进行精密测定和描述,其目的是为人类的活动提供必要的海洋空间信息。同陆地测量相比,海洋测量具有明显的动态效应,海上测量工作必须在不断运动着的海面上进行。就某同一观测量来说,无法进行重复观测,因此海洋测量缺乏必要的成果质量检核手段,这便使得测量结果的可靠性大打折扣。有时候,某些异常数据可能正是客观事物内在的尚未被人们认识的新规律,因此它不完全等同于粗差,有时不能任意舍掉。本文介绍了PanTapan判别法、Chauvenet判别法、样本分位数判别法,进行异常数据的判别,并对各种检验方法做出比较。
关键词:海洋测量,异常数据,PanTapan判别法、Chauvenet判别法、样本分位数判别法
0 引言
人们对数据进行分析处理的过程中,经常会遇到少量这样的数据,它们与数据一般模式不一致,或者说与大多数样相比有些不一样,称这样的数据为异常数据。异常数据是少量的、与众不同的,与大多数数据相比是有偏差的,而且产生这种偏差的原因不是随机的,而是有其更深层次的必然原因,它产生于完全不同的机制。为了从数据集中识别异常数据,就必须有一个明确的标准。这需要找到数据的内在规律,在一个可接受的误差范围内,满足内在规律的数据就是正常数据,而不满足内在规律的数据就是异常数据。本文通过几种异常数据的判别法对海洋测量中海底高程数据进行了相关的讨论,得出了有益的结论。
1 几种异常数据的统计检验方法
1.1 莱茵达(PanTa)判别法
对于采集几个数据的测量列X1、X2…,Xn,先求得算术平均值,剩余误差= 一,然后再根据贝塞尔法求得均方根偏差。判别依据如下(假设v:符合正态分布,即测量列也服从正态分布):
|一|>3σ,则Xi为粗大误差,应予舍弃;
|一|≤3σ,则Xi为正常数据,应予保留。
根据概率论统计,当误差服从正态分布时,误差大于3σ的观测数据出现的概率小于0.003,即在大于300次的观测中才有出现1次的可能。因此,若采用莱因达准则(亦称3σ准则)进行粗差剔除时,置弃概率是较小的。这样有时就会将不合理的异常值也予以保留。
1.2 肖维勒(Chauvenet)判别法
肖维勒准则也是以正态分布为前提的。假设多次重复测量所得n个测量值中,某数据的残余误差||>Zc·σ,则剔除此数据。,实用中由于Zc<3(Zc是样品容量为n时的判别系数),所以这在一定程度上弥补了莱因达准则的不足,相对莱因达准则而言,这一判别准则要苛刻得多。(Zc与n的关系由表1-1给出)
表1-1 Zc与n值的对应关系
N 3 4 5 6 7 8 9 10 11 12 Zc 1.38 1.54 1.73 1.73 1.80 1.88 1.92 1.96 2.00 2.03 N 13 14 15 16 18 20 30 40 50 Zc 2.07 2.10 2.13 2.15 2.20 2.24 2.39 2.49 2.58 1.3 样本分位数判别法
当正态分布的方差未知时,采用1/4样本分位数法,若怀疑异常,计算高端上侧(低端下侧)异常值检验统计量,若无法确定异常值出现在哪一侧,则计算双侧统计量MRS:
, (1-1)
(1-2)
其中,,
上式分别称、和MRS为总体方差未知时,右侧、左侧和两侧异常值检验统计量。显然,在这些统计量中用作为总体位置参数的估计,用作为尺度参数的估计,由于样本分位数具有较高的抗异常值污染的能力,因此由其构成的检验统计量同样具有较强的抗差性,即这些估计都具有抵抗异常值污染的能力。文献[5]给出了n值在显著水平α分别取0.10、0.05和0.01时,、和MRS的临界值。当由样本计算得到的、和MRS值大于它们相应的临界值时,即可判定在给定的显著水平条件下,被检测观测值为异常值。如表1-2、表1-3所示。
表1-2 Sn、S1检验的临界值
n α n α 0.10 0.05 0.01 0.10 0.05 0.01 6 2047 2535 3104 28 1944 2177 2708 7 1608 2031 2676 29 2248 2525 2944 8 1400 1739 2645 30 2142 2407 2906 9 2454 2697 3085 31 2039 2290 28
您可能关注的文档
- 英语正在愈来愈被看成一种国际交往的讲述.doc
- 河北省平泉四海中学七年级生物上册2.2.2动物体的结构层次课件讲义.ppt
- 河北省迁安市二中2015-2016学年高一上学期期末考试政治试卷讲义.doc
- 河北省秦皇岛市卢龙县2015-2016学年高二历史上学期期末考试试题讲义.doc
- 河北省秦皇岛市卢龙县2015-2016学年高二上学期期末考试历史试卷讲义.doc
- 河北省石家庄二中2017届高三上学期月考物理试卷(9月份)Word版含解析讲义.doc
- 海水的温度和盐度讲义.pptx
- 河北省石家庄市2015届高三高中毕业班第一次模拟考试理综讲义.doc
- 沃尔玛企业文化()讲述.ppt
- 河北省石家庄市2016届高三下学期复习教学质检(二)政治试卷讲义.doc
文档评论(0)