[目的]针对模糊聚类任务中模糊化参数难以预设以及二型模糊集在解模糊阶段计算量大的问题,本文旨在提供一种高效且稳健的二型模糊聚类方法,以兼顾计算速度与聚类准确性.[方法]提出一种基于数字特征的二型模糊聚类模型(characteristic ba...[目的]针对模糊聚类任务中模糊化参数难以预设以及二型模糊集在解模糊阶段计算量大的问题,本文旨在提供一种高效且稳健的二型模糊聚类方法,以兼顾计算速度与聚类准确性.[方法]提出一种基于数字特征的二型模糊聚类模型(characteristic based type 2 FCM,CBT2FCM).该方法在目标函数中同时引入样本与簇中心的距离以及二型模糊集的数字特征,实现类簇中心与二型模糊隶属度的联合优化.算法在迭代过程中仅需更新数字特征,无需执行Karnik-Mendel解模糊过程,从而显著降低计算复杂度并提升抗噪性能.[结果]本文方法基本不受噪声影响:在公开数据集WDBC上,无监督的情况下,本文方法的聚类准确率达72.84%;在IMDb电影评论数据集上,当噪声率从0.1增加到1时,本文的聚类准确率从71.67%增加到72.05%,高于次优方法FCM的69.65%,运行时间从2.18 s增加到3.63 s,仅次于最优方法FCM的2.37 s,展现出良好的稳定性与计算效率.[结论]在公开数据集及电影分类数据集上的实验结果表明,该方法在聚类准确率、噪声容忍度及运行时间方面均优于传统聚类算法,具有通用性与有效性.展开更多
针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(densit...针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法获取每种相似性距离的聚类结果。计算每种聚类结果的轮廓系数、戴维森堡丁指数和聚类簇数等3项指标,分析DBSCAN超参数变化下这3项指标的稳定性,筛选出稳定性高的相似性距离。采用筛选出的稳定相似性距离进行轨迹聚类,分析并筛选出最优相似性距离。实验验证了筛选方法的有效性,表明基于经纬度的豪斯多夫(Hausdorff)距离与基于航向的动态时间规整(dynamic time warping,DTW)距离组合的聚类结果最佳,能更全面地完成港内船舶轨迹聚类,并识别典型交通流。本文研究成果能为港口交通流识别和特征数据挖掘提供有效方法,为船舶轨迹聚类相似性距离选择提供指导。展开更多
文摘[目的]针对模糊聚类任务中模糊化参数难以预设以及二型模糊集在解模糊阶段计算量大的问题,本文旨在提供一种高效且稳健的二型模糊聚类方法,以兼顾计算速度与聚类准确性.[方法]提出一种基于数字特征的二型模糊聚类模型(characteristic based type 2 FCM,CBT2FCM).该方法在目标函数中同时引入样本与簇中心的距离以及二型模糊集的数字特征,实现类簇中心与二型模糊隶属度的联合优化.算法在迭代过程中仅需更新数字特征,无需执行Karnik-Mendel解模糊过程,从而显著降低计算复杂度并提升抗噪性能.[结果]本文方法基本不受噪声影响:在公开数据集WDBC上,无监督的情况下,本文方法的聚类准确率达72.84%;在IMDb电影评论数据集上,当噪声率从0.1增加到1时,本文的聚类准确率从71.67%增加到72.05%,高于次优方法FCM的69.65%,运行时间从2.18 s增加到3.63 s,仅次于最优方法FCM的2.37 s,展现出良好的稳定性与计算效率.[结论]在公开数据集及电影分类数据集上的实验结果表明,该方法在聚类准确率、噪声容忍度及运行时间方面均优于传统聚类算法,具有通用性与有效性.
文摘针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法获取每种相似性距离的聚类结果。计算每种聚类结果的轮廓系数、戴维森堡丁指数和聚类簇数等3项指标,分析DBSCAN超参数变化下这3项指标的稳定性,筛选出稳定性高的相似性距离。采用筛选出的稳定相似性距离进行轨迹聚类,分析并筛选出最优相似性距离。实验验证了筛选方法的有效性,表明基于经纬度的豪斯多夫(Hausdorff)距离与基于航向的动态时间规整(dynamic time warping,DTW)距离组合的聚类结果最佳,能更全面地完成港内船舶轨迹聚类,并识别典型交通流。本文研究成果能为港口交通流识别和特征数据挖掘提供有效方法,为船舶轨迹聚类相似性距离选择提供指导。