-
题名基于混合邻域图的复杂结构数据集层次聚类算法
被引量:1
- 1
-
-
作者
陈仲尚
冯骥
杨德刚
蔡发鹏
-
机构
重庆师范大学计算机与信息科学学院
-
出处
《智能系统学报》
北大核心
2025年第3期584-593,共10页
-
基金
重庆市教委科学技术研究项目(KJZD-M202300502,KJQN201800539)。
-
文摘
复杂结构数据集通常指包含不同形状(如球形、非球形、流形)、大小和密度的簇的数据集。自然邻居算法在处理边界模糊、密度变化的数据集时存在局限性,特别是在数据集中含有大量噪声时,其性能会显著下降。针对这些问题,本文提出一种基于混合邻域图的复杂结构数据集层次聚类算法(hybrid neighborhood graphbased hierarchical clustering algorithm for datasets with complex structures,HCHNG)。该方法提出一种共享自然邻域图方法,通过邻居关系稀疏数据集以减少噪声样本对聚类结果的影响。随后,HCHNG将数据集划分为子图并加以合并,这一策略增强了算法处理变密度数据集的能力,同时,定义一种新的子图相似性度量方法,提高同类子图间的相似性。此外,对自然邻域图进行改进,以提升其在识别边界模糊数据集时的性能。在具有复杂结构的人工数据集和真实数据集上的对比实验表明,本文算法不仅能有效识别变密度球形数据集,而且在含有大量噪声的复杂数据集中也拥有优越的性能,在处理具有复杂结构的数据集时比现有方法高效。
-
关键词
聚类分析
混合邻域图
共享自然邻居
改进的自然邻域图
共享自然邻域图
子图相似性
复杂数据集
数据挖掘
-
Keywords
cluster analysis
hybrid neighborhood graph
shared natural neighbors
improved natural neighborhood graph
shared natural neighborhood graph
subgraph similarity
complex dataset
data mining
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种新的图聚类算法研究
被引量:5
- 2
-
-
作者
唐德权
吴绍兵
凌志刚
-
机构
湖南警察学院信息技术系
云南警官学院信息网络安全学院
湖南大学电气与信息工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第6期18-20,58,共4页
-
基金
国家高新技术研究发展计划项目(2012AA112312)
教育部高等学校博士学科点专项科研基金项目(20110161120006)
湖南警察学院自然科学基金项目(2011YB02)
-
文摘
图聚类是基于各种标准如结点标号、边标号、公共子图等条件将图数据集实例划分不同类集群,这将对结构化图空间及增强对图数据的理解有着重要作用。针对此问题提出基于结构化的图聚类算法。与目前有关的算法相比,该算法不产生新图或原图分解成零碎子图,也不依赖计算最大共同子图的相关操作。实验结果表明,这种方法在现实分子图数据集上对结构聚类可行、有效。
-
关键词
集群
结构聚类
图数据集
频繁子图挖掘
-
Keywords
clusters structural clustering graph datasets frequent subgraph mining
-
分类号
TP311.2
[自动化与计算机技术—计算机软件与理论]
-