论文部分内容阅读
建设海洋强国是全面建设社会主义现代化强国的重要组成部分,海洋大数据作为基础战略资源,是衡量一个国家海洋监管能力的重要标志,随着信息技术的迅猛发展,以卫星海洋遥感数据为代表的海洋数据规模呈现爆炸式增长趋势,海洋研究进入大数据时代,如何收集、管理和挖掘海洋数据是世界各海洋强国研究的重点方向。本文以国防科技大学研制的天拓三号卫星收集的天基AIS数据作为数据支撑,结合机器学习相关算法,从分类、聚类和回归三个角度开展天基AIS数据挖掘研究,探索适用于天基AIS数据驱动的挖掘理论和方法。本文的主要工作如下:首先,本文在对当前AIS数据挖掘现状和发展趋势进行总结、归纳的基础上,综合分析了天基AIS数据在海上交通监管领域的独特优势,认为天基AIS相对于传统岸基AIS和其他数据源相比具有覆盖范围广、跟踪时间长以及信息类型丰富等特点,较适合于进行大地理范围、长时间跨度等宏观层面海上交通研究。进一步地,面向提升海上交通智能化监管的实际需求,提出三个可以研究的方向:船舶分类、航线挖掘和行为预测。提出了一种基于随机森林的船舶分类方法。根据不同类型船舶的特点在传统几何特征分析的基础上引入了船舶运动特征的提取和分析,探讨了随机森林两种主要算法参数在不同组合下对五种船舶分类结果的影响,研究发现,所提取的特征较好的反映了不同类型船舶之间的差异性,在同时考虑几何特征和运动特征的情况下,算法分类准确率能够达到80%左右,研究了分类过程中的特征重要性问题,通过对比实验发现了某些在分类过程中起到关键作用的重要特征,并对分类结果存在异常的船舶进行了实例分析,验证了方法的有效性。提出了一种基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)密度聚类算法的航线挖掘方法。考虑了基于位置点聚类和基于子轨迹聚类两种聚类方式,针对第一种聚类方式,在经典DBSCAN算法的基础上加入了航向约束并改进了搜索域,通过在澳大利亚海域AIS数据上进行聚类实验,发现在合适的参数设置下该算法能够有效提取目标海域热点航线,通过KDE和统计方法分析,能够实现对挖掘航线的海上交通情况的感知;针对第二种聚类方式,提出了一种适用于天基AIS数据的子轨迹样本提取方法,结合DTW距离度量方法实现轨迹层面的密度聚类,并从开发北极航线的实际需求出发,将该聚类方法应用于北极地区AIS数据分析之中,聚类结果可用于了解目前北极航线通航情况并为制定北极战略提供信息支撑。提出了一种基于LSTM(Long Short-Term Memory)循环神经网络的船舶位置预测方法。设计了一种4层LSTM单元的神经网络结构并采用了5个时间步的网络训练方法从单个船舶历史数据进行船舶运动模式学习,预测结果表明,在船舶正常航行的状态下,模型的预测误差控制在100m以下,出现运动状态突变的情况下,预测误差较大。该方法可用于异常船舶发现和监控以及海上交通事故的预防。论文探讨了基于机器学习的天基AIS数据挖掘方法,在算法层面上进行了大量适应性改进,并成功应用于船舶分类识别、航线挖掘和位置预测任务当中,研究旨在从天基AIS数据中发现有价值的海上交通信息进而提升海上态势感知能力和卫星遥感数据应用的智能化水平。