针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(densit...针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法获取每种相似性距离的聚类结果。计算每种聚类结果的轮廓系数、戴维森堡丁指数和聚类簇数等3项指标,分析DBSCAN超参数变化下这3项指标的稳定性,筛选出稳定性高的相似性距离。采用筛选出的稳定相似性距离进行轨迹聚类,分析并筛选出最优相似性距离。实验验证了筛选方法的有效性,表明基于经纬度的豪斯多夫(Hausdorff)距离与基于航向的动态时间规整(dynamic time warping,DTW)距离组合的聚类结果最佳,能更全面地完成港内船舶轨迹聚类,并识别典型交通流。本文研究成果能为港口交通流识别和特征数据挖掘提供有效方法,为船舶轨迹聚类相似性距离选择提供指导。展开更多
文摘针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法获取每种相似性距离的聚类结果。计算每种聚类结果的轮廓系数、戴维森堡丁指数和聚类簇数等3项指标,分析DBSCAN超参数变化下这3项指标的稳定性,筛选出稳定性高的相似性距离。采用筛选出的稳定相似性距离进行轨迹聚类,分析并筛选出最优相似性距离。实验验证了筛选方法的有效性,表明基于经纬度的豪斯多夫(Hausdorff)距离与基于航向的动态时间规整(dynamic time warping,DTW)距离组合的聚类结果最佳,能更全面地完成港内船舶轨迹聚类,并识别典型交通流。本文研究成果能为港口交通流识别和特征数据挖掘提供有效方法,为船舶轨迹聚类相似性距离选择提供指导。