期刊文献+
共找到379篇文章
< 1 2 19 >
每页显示 20 50 100
Distance function selection in several clustering algorithms
1
作者 LUYu 《Journal of Chongqing University》 CAS 2004年第1期47-50,共4页
Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical... Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical clustering were investigated. Both theoretical analysis and detailed experimental results were given. It is shown that a distance function greatly affects clustering results and can be used to detect the outlier of a cluster by the comparison of such different results and give the shape information of clusters. In practice situation, it is suggested to use different distance function separately, compare the clustering results and pick out the 搒wing points? And such points may leak out more information for data analysts. 展开更多
关键词 distance function clustering algorithms K-MEANS DENDROGRAM data mining
在线阅读 下载PDF
Flight Trajectory Option Set Generation Based on Clustering Algorithms
2
作者 WANG Shijin SUN Min +1 位作者 LI Yinglin YANG Baotian 《Transactions of Nanjing University of Aeronautics and Astronautics》 2025年第6期767-788,共22页
Addressing the issue that flight plans between Chinese city pairs typically rely on a single route,lacking alternative paths and posing challenges in responding to emergencies,this study employs the“quantile-inflecti... Addressing the issue that flight plans between Chinese city pairs typically rely on a single route,lacking alternative paths and posing challenges in responding to emergencies,this study employs the“quantile-inflection point method”to analyze specific deviation trajectories,determine deviation thresholds,and identify commonly used deviation paths.By combining multiple similarity metrics,including Euclidean distance,Hausdorff distance,and sector edit distance,with the density-based spatial clustering of applications with noise(DBSCAN)algorithm,the study clusters deviation trajectories to construct a multi-option trajectory set for city pairs.A case study of 23578 flight trajectories between the Guangzhou airport cluster and the Shanghai airport cluster demonstrates the effectiveness of the proposed framework.Experimental results show that sector edit distance achieves superior clustering performance compared to Euclidean and Hausdorff distances,with higher silhouette coefficients and lower Davies⁃Bouldin indices,ensuring better intra-cluster compactness and inter-cluster separation.Based on clustering results,19 representative trajectory options are identified,covering both nominal and deviation paths,which significantly enhance route diversity and reflect actual flight practices.This provides a practical basis for optimizing flight paths and scheduling,enhancing the flexibility of route selection for flights between city pairs. 展开更多
关键词 flight trajectory clustering trajectory option set sector edit distance density-based spatial clustering of applications with noise(DBSCAN)algorithm deviation trajectories
在线阅读 下载PDF
A Leukocyte image fast scanning based on max–min distance clustering 被引量:1
3
作者 Yapin Wang Yiping Cao 《Journal of Innovative Optical Health Sciences》 SCIE EI CAS 2016年第6期50-57,共8页
A leukocyte image fast scanning method based on max min distance clustering is proposed.Because of the lower proportion and uneven distribution of leukocytes in human peripheral blood,there will not be any leukocyte i... A leukocyte image fast scanning method based on max min distance clustering is proposed.Because of the lower proportion and uneven distribution of leukocytes in human peripheral blood,there will not be any leukocyte in lager quantity of the captured images if we directly scan the blood smear along an ordinary zigzag scanning routine with high power(100^(x))objective.Due to the larger field of view of low power(10^(x))objective,the captured low power blood smear images can be used to locate leukocytes.All of the located positions make up a specific routine,if we scan the blood smear along this routine with high power objective,there will be definitely leukocytes in almost all of the captured images.Considering the number of captured images is still large and some leukocytes may be redundantly captured twice or more,a leukocyte clustering method based on max-min distance clustering is developed to reduce the total number of captured images as well as the number of redundantly captured leukocytes.This method can improve the scanning eficiency obviously.The experimental results show that the proposed method can shorten scanning time from 8.0-14.0min to 2.54.0 min while extracting 110 nonredundant individual high power leukocyte images. 展开更多
关键词 Leukocyte image fast scanning scanning routine max-min distance clustering window clustering microscopic imaging image segmentation
原文传递
Ant colony ATTA clustering algorithm of rock mass structural plane in groups 被引量:11
4
作者 李夕兵 王泽伟 +1 位作者 彭康 刘志祥 《Journal of Central South University》 SCIE EI CAS 2014年第2期709-714,共6页
Based on structural surface normal vector spherical distance and the pole stereographic projection Euclidean distance,two distance functions were established.The cluster analysis of structure surface was conducted by ... Based on structural surface normal vector spherical distance and the pole stereographic projection Euclidean distance,two distance functions were established.The cluster analysis of structure surface was conducted by the use of ATTA clustering methods based on ant colony piles,and Silhouette index was introduced to evaluate the clustering effect.The clustering analysis of the measured data of Sanshandao Gold Mine shows that ant colony ATTA-based clustering method does better than K-mean clustering analysis.Meanwhile,clustering results of ATTA method based on pole Euclidean distance and ATTA method based on normal vector spherical distance have a great consistence.The clustering results are most close to the pole isopycnic graph.It can efficiently realize grouping of structural plane and determination of the dominant structural surface direction.It is made up for the defects of subjectivity and inaccuracy in icon measurement approach and has great engineering value. 展开更多
关键词 rock mass discontinuity cluster analysis ant colony ATTA algorithm distance function Silhouette index
在线阅读 下载PDF
Design of Evolutionary Algorithm Based Energy Efficient Clustering Approach for Vehicular Adhoc Networks
5
作者 VDinesh SSrinivasan +1 位作者 Gyanendra Prasad Joshi Woong Cho 《Computer Systems Science & Engineering》 SCIE EI 2023年第7期687-699,共13页
In a vehicular ad hoc network(VANET),a massive quantity of data needs to be transmitted on a large scale in shorter time durations.At the same time,vehicles exhibit high velocity,leading to more vehicle disconnections... In a vehicular ad hoc network(VANET),a massive quantity of data needs to be transmitted on a large scale in shorter time durations.At the same time,vehicles exhibit high velocity,leading to more vehicle disconnections.Both of these characteristics result in unreliable data communication in VANET.A vehicle clustering algorithm clusters the vehicles in groups employed in VANET to enhance network scalability and connection reliability.Clustering is considered one of the possible solutions for attaining effectual interaction in VANETs.But one such difficulty was reducing the cluster number under increasing transmitting nodes.This article introduces an Evolutionary Hide Objects Game Optimization based Distance Aware Clustering(EHOGO-DAC)Scheme for VANET.The major intention of the EHOGO-DAC technique is to portion the VANET into distinct sets of clusters by grouping vehicles.In addition,the DHOGO-EAC technique is mainly based on the HOGO algorithm,which is stimulated by old games,and the searching agent tries to identify hidden objects in a given space.The DHOGO-EAC technique derives a fitness function for the clustering process,including the total number of clusters and Euclidean distance.The experimental assessment of the DHOGO-EAC technique was carried out under distinct aspects.The comparison outcome stated the enhanced outcomes of the DHOGO-EAC technique compared to recent approaches. 展开更多
关键词 Vehicular networks clustering evolutionary algorithm fitness function distance metric
在线阅读 下载PDF
基于Max-min distance聚类算法的园地空间聚类--以永泰县嵩口镇为例
6
作者 冯宇琳 《测绘与空间地理信息》 2024年第7期146-149,共4页
空间聚类是空间数据挖掘的重要手段之一。本文研究了一种基于质心点距离的Max-min distance空间聚类算法:通过加载园地图斑数据,计算其园地图斑质心,判断聚类中心之间的距离,并将符合条件的园地图斑进行聚类,最终将聚类结果可视化表达... 空间聚类是空间数据挖掘的重要手段之一。本文研究了一种基于质心点距离的Max-min distance空间聚类算法:通过加载园地图斑数据,计算其园地图斑质心,判断聚类中心之间的距离,并将符合条件的园地图斑进行聚类,最终将聚类结果可视化表达。本文的算法是利用Visual Studio 2017实验平台和ArcGIS Engine组件式开发环境,采用C#语言进行编写。实验结果表明:1)Max-mindistance聚类通过启发式的选择簇中心,克服了K-means选择簇中心过于邻近的缺点,能够适应嵩口镇等山区丘陵地区空间分布呈破碎的园地数据集分布,有效地实现园地的合理聚类;2)根据连片面积将园地空间聚类结果分为大中小三类,未来嵩口镇可以重点发展园地连片规模较大的村庄,形成规模化的青梅种植园。 展开更多
关键词 max-mindistance聚类算法 园地 GIS 嵩口镇
在线阅读 下载PDF
基于激光雷达采集数据的车辆防碰撞预警研究
7
作者 杨俊亭 李发国 张少华 《电子设计工程》 2026年第2期188-191,196,共5页
在电磁干扰和天气条件影响下,为实时更新车辆周围三维环境信息,提升驾驶员行驶的安全性,设计基于激光雷达采集数据的车辆防碰撞预警方法。采集车辆运行环境三维点云数据、目标车辆角度与距离点云数据;对三维点云数据进行聚类处理,得到... 在电磁干扰和天气条件影响下,为实时更新车辆周围三维环境信息,提升驾驶员行驶的安全性,设计基于激光雷达采集数据的车辆防碰撞预警方法。采集车辆运行环境三维点云数据、目标车辆角度与距离点云数据;对三维点云数据进行聚类处理,得到障碍物聚类簇;拟合聚类簇的边界特征,完成前车目标检测;对比分析前车点云数据以及角度与距离点云数据,保存吻合点云数据;建立前向安全距离模型,确定车辆行驶安全距离;当与前车距离小于安全距离时,发出警报,避免碰撞发生。实验证明,该方法可有效采集并聚类处理车辆运行环境三维点云数据,计算目标车辆1的运行速度在57~59 km/h之间,目标车辆2的运行速度在60~62 km/h之间,可确定安全距离。 展开更多
关键词 激光雷达 数据采集 车辆防碰撞 密度聚类算法 迭代终点拟合 安全距离模型
在线阅读 下载PDF
A New Line Symmetry Distance and Its Application to Data Clustering 被引量:1
8
作者 Sriparna Saha Sanghamitra Bandyopadhyay 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第3期544-556,共13页
In this paper, at first a new line-symmetry-based distance is proposed. The properties of the proposed distance are then elaborately described. Kd-tree-based nearest neighbor search is used to reduce the complexity of... In this paper, at first a new line-symmetry-based distance is proposed. The properties of the proposed distance are then elaborately described. Kd-tree-based nearest neighbor search is used to reduce the complexity of computing the proposed line-symmetry-based distance. Thereafter an evolutionary clustering technique is developed that uses the new linesymmetry-based distance measure for assigning points to different clusters. Adaptive mutation and crossover probabilities are used to accelerate the proposed clustering technique. The proposed GA with line-symmetry-distance-based (GALSD) clustering technique is able to detect any type of clusters, irrespective of their geometrical shape and overlapping nature, as long as they possess the characteristics of line symmetry. GALSD is compared with the existing well-known K-means clustering algorithm and a newly developed genetic point-symmetry-distance-based clustering technique (GAPS) for three artificial and two real-life data sets. The efficacy of the proposed line-symmetry-based distance is then shown in recognizing human face from a given image. 展开更多
关键词 unsupervised classification clustering symmetry property line-symmetry-based distance KD-TREE genetic algorithm face recognition
原文传递
基于距离度量的癌症预测分类算法研究
9
作者 殷丽凤 刘浩琦 《大连交通大学学报》 2025年第2期106-112,共7页
为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有... 为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有属性放入GBM和XGBoost分类器进行学习的方式来压缩数据属性,以减少分类器的训练压力、提高训练效率,并用训练好的模型对测试集进行预测。最后,设计3组不同训练方式进行对比试验,用分类评估标准评估模型性能,并控制参数从多个角度验证TCDM的合理性。试验结果表明,TCDM相较于其他分类模型在癌症识别领域中有更高的性能和准确率。 展开更多
关键词 分类算法 余弦相似度 马氏距离 曼哈顿距离 K-MEANS聚类
在线阅读 下载PDF
高比例光伏接入场景下基于统计距离与动态无功储备的配电网稳定分区策略
10
作者 王健 孙玉峰 王劼妍 《东北电力大学学报》 2025年第4期97-107,共11页
随着光伏高比例接入配电网,光伏出力的随机性和波动性使得电网潮流复杂多变,光伏在恒功率因数控制下的有功出力随机变化也会导致无功出力随机变化,目前基于线路无功潮流的无功/电压分区结果会因为线路无功潮流频繁变化,导致分区结果不... 随着光伏高比例接入配电网,光伏出力的随机性和波动性使得电网潮流复杂多变,光伏在恒功率因数控制下的有功出力随机变化也会导致无功出力随机变化,目前基于线路无功潮流的无功/电压分区结果会因为线路无功潮流频繁变化,导致分区结果不断变化,部分节点频繁切换隶属分区,引起鲁棒性问题。文中提出一种基于概率统计距离构建新电气距离的稳定无功/电压分区方法。首先,通过高斯混合模型(Gaussian Mixture Model,GMM)刻画光伏有功出力的随机特征,根据功率因数得到光伏无功出力特征;接着利用蒙特卡洛模拟法(Monte Carlo Simulation,MCS)进行概率潮流计算,得到配电网节点电压的随机分布;随后,根据得到的节点电压分布应用推土机距离(Earth Mover's Distance,EMD)定义节点间统计距离,再结合节点电压灵敏度,定义一种新的电气距离;最后,采用近邻传播(Affinity Propagation,AP)聚类算法和动态无功储备约束得到分区结果。基于IEEE 33节点系统的仿真结果表明,文中提出的分区方法在光伏高比例接入场景下具有较好的稳定性,能有效应对潮流频繁变化带来的挑战。 展开更多
关键词 高比例光伏 恒功率因数 无功/电压分区 高斯混合模型 概率潮流 统计距离 近邻传播聚类算法 动态无功储备
在线阅读 下载PDF
基于大数据的港口运输距离测算模型构建
11
作者 张凤 叶劲松 +3 位作者 杨艳芳 刘晗 李洪囤 王松涛 《交通运输研究》 2025年第4期104-112,共9页
为实现全国港口运输距离的动态更新,降低人工依赖性,更及时高效地计算水路运输周转量,本文基于水运业务大数据,开展了港口间运输距离测算模型的构建与应用研究。首先,对船舶自动识别系统(Automatic Identification System,AIS)数据与进... 为实现全国港口运输距离的动态更新,降低人工依赖性,更及时高效地计算水路运输周转量,本文基于水运业务大数据,开展了港口间运输距离测算模型的构建与应用研究。首先,对船舶自动识别系统(Automatic Identification System,AIS)数据与进出港报告数据的内容、特征进行了系统分析,明确了两类数据之间的关联性。其次,提出一种基于水运大数据的融合关联分析方法,结合航线可达性与运输频次,采用DBSCAN聚类算法识别核心港口节点,构建基于实际航行路径的港口运输距离测算模型。最后,选取典型内河港口与沿海港口进行实证分析。结果表明,该模型计算结果与测量结果的误差在5%以内,具有较高的准确性。研究成果可为水路运输规划、运力调度及周转量统计提供科学依据,同时为智慧港口建设与航运大数据应用提供技术参考。 展开更多
关键词 AIS数据 进出港报告数据 港口间运输距离 DBSCAN聚类算法 船舶航行轨迹
在线阅读 下载PDF
面向关节置换术的跨源点云配准优化算法
12
作者 聂雨晨 徐琦 +2 位作者 邓正强 周迪斌 刘文浩 《杭州师范大学学报(自然科学版)》 2025年第2期113-120,共8页
在跨源点云配准上,由于点云数据密度变化、噪声和异常值、数据缺失等问题,易导致传统的配准策略陷入局部最优解,算法精度降低.针对该问题,提出一种面向关节置换术的改进点云配准算法NCD-ICP.首先,设计一个两阶段筛选策略.采用二重聚类... 在跨源点云配准上,由于点云数据密度变化、噪声和异常值、数据缺失等问题,易导致传统的配准策略陷入局部最优解,算法精度降低.针对该问题,提出一种面向关节置换术的改进点云配准算法NCD-ICP.首先,设计一个两阶段筛选策略.采用二重聚类策略对目标点云数据的内、外点进行筛选,随后采用最大曲率特征筛选点云.其次,利用超广义四点全等集进行粗配准计算.最后,在精配准阶段引入节点余弦距离的概念,先计算源点云点与点云圆心、质心的余弦距离,再与目标点云中候选点计算所得余弦距离逐一比较,确定最佳的初始点对并进行迭代.实验结果表明,NCD-ICP算法可显著减少参与配准的点云数据量和迭代次数,实现关节置换术中跨源点云的精确配准,且避免陷入局部最优解. 展开更多
关键词 ICP算法 跨源点云配准 二重聚类 最大曲率 节点余弦距离
在线阅读 下载PDF
智能电网多智能体信息自动化融合模型构建 被引量:2
13
作者 崔跃君 张浩海 +2 位作者 王昊 王磊 顾新桥 《自动化技术与应用》 2025年第1期110-114,共5页
智能电网多智能体信息具有多源异构性,有效利用信息的准确性较低,融合效率不佳。针对上述问题,构建一种智能电网多智能体信息自动化融合模型。利用数据仓库技术集成智能电网多智能体信息,并实施完整性处理和异常值处理。为降低信息量、... 智能电网多智能体信息具有多源异构性,有效利用信息的准确性较低,融合效率不佳。针对上述问题,构建一种智能电网多智能体信息自动化融合模型。利用数据仓库技术集成智能电网多智能体信息,并实施完整性处理和异常值处理。为降低信息量、信息维度,提取信息距离熵特征,计算匹配系数。然后以匹配系数为输入值,通过K均值聚类算法将同类别的智能电网多智能体信息划分到一起,实现信息自动化融合。实验结果表明:应用所构建的自动化模型,同类融合的信息间一致性达到最大值,均在0.8以上;时间开销均达到最小值,由此说明所构建的模型融合准确性更高,融合效率较好。 展开更多
关键词 智能电网 多智能体 信息集成 距离熵 K均值聚类算法 自动化融合
在线阅读 下载PDF
基于几何的K-means初始聚类中心优化算法研究 被引量:1
14
作者 周晓东 董海清 +2 位作者 张昆鹏 侯俊丞 孙树峰 《仪表技术》 2025年第2期66-69,73,共5页
传统的K-means算法对初始聚类中心较为敏感,聚类结果随初始输入不同而波动显著,且易陷入局部最优解。为消除该敏感性,提出了一种改进初始聚类中心选取的新方法。运用主成分分析将高维数据降至平面二维,随后计算每个数据对象的欧氏距离... 传统的K-means算法对初始聚类中心较为敏感,聚类结果随初始输入不同而波动显著,且易陷入局部最优解。为消除该敏感性,提出了一种改进初始聚类中心选取的新方法。运用主成分分析将高维数据降至平面二维,随后计算每个数据对象的欧氏距离与向量角度参数,建立距离角度混合评价模型,选取k个分散性最高的数据点作为初始聚类中心。实验结果表明,该算法对处理高维数据具有一定的优越性,尤其对非簇状数据集能产生较优的聚类结果,并且消除了初始输入的敏感性。 展开更多
关键词 聚类中心 K-MEANS算法 欧氏距离 角度参数
原文传递
改进模糊聚类下电力多源异构数据动态挖掘 被引量:2
15
作者 王震峰 《电子设计工程》 2025年第9期125-129,134,共6页
为了提高电力多源异构数据动态挖掘效果及结果可靠性,采用了改进模糊聚类方法。引入隶属度函数,以更好地描述电力数据的不确定性。为了更准确地描述多源异构电力数据样本间的相似度,利用加权马氏距离替代模糊C均值聚类算法中的欧氏距离... 为了提高电力多源异构数据动态挖掘效果及结果可靠性,采用了改进模糊聚类方法。引入隶属度函数,以更好地描述电力数据的不确定性。为了更准确地描述多源异构电力数据样本间的相似度,利用加权马氏距离替代模糊C均值聚类算法中的欧氏距离,从而提升动态挖掘的精度。此外,结合蚁群算法,确定模糊C均值聚类算法的初始聚类中心与聚类中心数量,进一步改进算法,并成功应用于电力多源异构数据的动态挖掘。通过实验验证,该方法在电力系统数据集中能够有效地进行动态挖掘,分析电力用户的用电模式,并且在不同异常值比例下均表现出较高的斯皮尔曼等级相关系数,证明了其动态挖掘结果的可靠性。 展开更多
关键词 改进模糊聚类 电力数据 多源异构 动态挖掘 马氏距离 蚁群算法
在线阅读 下载PDF
结合密度峰值和樽海鞘群搜索的数据聚类算法
16
作者 卢志刚 郑鑫鑫 李玉 《无线电工程》 2025年第12期2431-2443,共13页
为了解决密度峰值聚类(Density Peaks Clustering,DPC)算法截断距离选取困难以及需人工选择聚类中心的问题,提出结合密度峰值和樽海鞘群搜索的数据聚类算法。在信息熵中引入密度测度,提出密度估计信息熵,并以此建立目标函数;利用樽海鞘... 为了解决密度峰值聚类(Density Peaks Clustering,DPC)算法截断距离选取困难以及需人工选择聚类中心的问题,提出结合密度峰值和樽海鞘群搜索的数据聚类算法。在信息熵中引入密度测度,提出密度估计信息熵,并以此建立目标函数;利用樽海鞘群搜索的寻优机制,得到最优截断距离参数;依据归一化局部密度和相对距离乘积,自适应选取聚类中心。为了验证所提算法的可行性和有效性,以8个典型人工合成数据集和2个UCI(University of California Irvine)真实数据集作为测试数据,与其他6种聚类算法相比较。研究结果表明,所提算法能有效解决传统DPC算法聚类中心选择的问题,避免了人工选取的主观性,克服了截断距离参数选取困难的问题。相对于比较算法,所提算法具有更强的全局搜索能力、更高的稳定性和更好的聚类效果。 展开更多
关键词 密度峰值 樽海鞘群算法 截断距离 数据聚类
在线阅读 下载PDF
最大距离法选取初始簇中心的K-means文本聚类算法的研究 被引量:112
17
作者 翟东海 鱼江 +2 位作者 高飞 于磊 丁锋 《计算机应用研究》 CSCD 北大核心 2014年第3期713-715,719,共4页
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实... 由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比,新提出的文本聚类算法在降低了聚类总耗时的同时,F度量值也有了明显提高。 展开更多
关键词 K-MEANS聚类算法 最大距离 文本聚类 文本距离 测度函数 F度量值
在线阅读 下载PDF
一种基于密度的K-means算法研究 被引量:44
18
作者 张琳 陈燕 +1 位作者 汲业 张金松 《计算机应用研究》 CSCD 北大核心 2011年第11期4071-4073,4085,共4页
针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距... 针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。 展开更多
关键词 K-MEANS算法 基于密度 类内距离 类间距离
在线阅读 下载PDF
用于负荷预测的层次聚类和双向夹逼结合的多层次聚类法 被引量:26
19
作者 贾慧敏 何光宇 +3 位作者 方朝雄 李可文 姚宇臻 黄妹妹 《电网技术》 EI CSCD 北大核心 2007年第23期33-36,共4页
针对传统聚类方法对负荷曲线形状的相似性重视不足的问题,提出了一种基于相似性原理的新的聚类方法——层次聚类和双向夹逼相结合的多层次聚类方法,该方法可以同时衡量负荷曲线形状的趋势相似性和形状相似性。分别采用该方法与传统的基... 针对传统聚类方法对负荷曲线形状的相似性重视不足的问题,提出了一种基于相似性原理的新的聚类方法——层次聚类和双向夹逼相结合的多层次聚类方法,该方法可以同时衡量负荷曲线形状的趋势相似性和形状相似性。分别采用该方法与传统的基于欧氏距离的层次聚类方法以某省2005年负荷数据为历史数据进行预测,结果表明本文提出方法对负荷曲线形态细节以及气候因素与负荷之间的复杂相关性具有较强的识别能力。 展开更多
关键词 聚类 欧氏距离 双向夹逼法 负荷预测
在线阅读 下载PDF
一种有效的K-means聚类中心初始化方法 被引量:87
20
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部