基于网络化密度聚类船舶停泊点数据挖掘.docVIP

基于网络化密度聚类船舶停泊点数据挖掘.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网络化密度聚类船舶停泊点数据挖掘

基于网络化密度聚类船舶停泊点数据挖掘   【摘 要】 为获取船舶停泊行为规律,以大连港、天津港、青岛港、德国罗斯托克港、巴西桑托斯港和荷兰格罗宁根港等全球六大港口水域为例,基于Hive数据仓库和R语言平台,利用网格化DBSCAN算法,提取船舶在各港口水域停泊点位置、面积等信息,进而基于停泊点可视化结果,验证这六大港口实时可视化结果与基于历史数据挖掘结果相符。研究成果有助于保障港口水域船舶安全通航,亦为船舶交通管理系统智能化奠定基础,从而推动港口行业持续、健康发展。   【关键词】 船舶自?邮侗鹣低常?AIS);数据挖掘技术;Hive数据仓库;网格化;空间密度聚类(DBSCAN)   0 引 言   港口作为海上交通枢纽及实现对外贸易往来的窗口,在促进地区经济发展方面起着重要作用。在世界经济全球化的今天,国际贸易量增长促进了港口行业的快速发展。在此背景下,加快港口水域船舶通航安全建设迫在眉睫,挖掘停泊点信息对于提高船舶安全通航至关重要。   借助数据挖掘技术和船舶自动识别系统(AIS),可对港口水域AIS数据进行深入数据挖掘,以获取船舶停泊行为规律。在船舶通航安全研究方面,现有研究较多考虑船舶交通流特征来分析船舶通航规律[1-2],未考虑停泊点作为港口水域运输枢纽在安全通航管理中的重要性。鉴于此,本文基于Hive数据仓库和R语言平台,结合港口水域船舶交通特征和网格化具有噪声的空间密度聚类(DBSCAN)法,对大连港、天津港、青岛港、德国罗斯托克港、巴西桑托斯港和荷兰格罗宁根港等全球六大港口水域的停泊点位置、面积等信息进行数据挖掘,进而基于动态船舶地图上的停泊点可视化,从停泊点面积、经纬度偏差两个方面,对比这六大港口实时可视化停泊点位置与历史数据挖掘结果比对,验证本文研究方法的有效性、合理性。   1 六大港水域船舶交通情况   船舶停泊点包括港口和锚地,其中:港口是船舶安全往来的运输枢纽,在国际贸易和运输系统中发挥着重要作用;锚地是船舶停靠泊位前的候泊场所,其大小在一定程度上影响船舶通航安全。[3] 因此,本文以全球具代表性的大连港、天津港、青岛港、德国罗斯托克港、巴西桑托斯港和荷兰格罗宁根港等六大港为例,利用AIS数据,对港口水域船舶停泊点进行数据挖掘。六大港口水域经纬度范围见表1,经纬度选取均在为提高数据利用率和算法运行效率,对六大港口水域AIS动态数据进行以下预处理:首先,从Hive数据仓库中导出2015年1月1日?D5月31日数据,利用R语言平台进行数据清理,包括去除重复及异常数据;其次,基于船舶在停泊点附近具有船速趋于零的特征,筛选出船速等于零的AIS观测数据。各港口水域船舶观测量见表2,其中:天津港船舶观测量最多,累计达26 661 494艘次;桑托斯港船舶观测量最少,累计达1 952 459艘次。   2 船舶停泊点数据挖掘算法及步骤   基于网格化的划分构造了一个全新的独立数据空间,将大量原始数据点放进具有经纬度范围属性的网格单元中,从而减少聚类对象以及降低噪声。DBSCAN算法可以过滤低密度区域,发现稠密度样本区域,因此将网格划分法与DBSCAN算法相结合,提出船舶停泊点数据挖掘的思路和方法。   利用Hive数据仓库和R语言平台,建立基于网格化的DBSCAN算法,从船舶停泊行为角度数据挖掘分析船舶交通行为,分析海上船舶停泊点,具体步骤如下:   步骤1:针对清理后的AIS数据,将经纬度进行网格化操作。选定港口水域经纬度范围均为00*100个网格。   步骤2:统计每个网格内的船舶数、航行速度、船舶停泊时间等信息,其中,若一艘船舶在同一个网格内出现的天数为n,则记船舶数为n。   步骤3:设定网格单元船舶数阈值,对网格进行筛选。当网格内船舶数低于150艘时,不予保存。   步骤4:针对筛选后的网格,利用DBSCAN算法进行聚类,得到若干分类簇作为停泊点,密度聚类半径参数设定为0.02,最小目标数为3。   步骤5:基于DBSCAN结果,统计各分类的位置信息和船舶信息,并将数据挖掘结果与动态船舶地图上的停泊点参照位置(Marine Traffic网站港口标识位置)进行比对,验证研究方法的正确性和有效性。   3 实证分析   3.1 国内三大港口停泊点数据挖掘结果   基于网格化DBSCAN算法,挖掘大连港、天津港、青岛港国内三大港口水域的停泊点数据,分别挖掘出停泊点4个、5个和4个,详情见表3。   验证结果如下:   (1)大连港水域1~4号停泊点的面积分别为3.23 km2、56.70 km2、27.00 km2和54.40 km2,停泊点的船舶艘数分别为、、和,其中2号停泊点的面积和船舶艘数均为最大,1号停泊点的面积和船舶艘数均最小。通过比较停泊点的面积和停泊点的

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档