期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
Edge-Weighted Centroidal Voronoi Tessellations 被引量:2
1
作者 Jie Wang Xiaoqiang Wang 《Numerical Mathematics(Theory,Methods and Applications)》 SCIE 2010年第2期223-244,共22页
Most existing applications of centroidal Voronoi tessellations(CVTs) lack consideration of the length of the cluster boundaries.In this paper we propose a new model and algorithms to produce segmentations which would ... Most existing applications of centroidal Voronoi tessellations(CVTs) lack consideration of the length of the cluster boundaries.In this paper we propose a new model and algorithms to produce segmentations which would minimize the total energy—a sum of the classic CVT energy and the weighted length of cluster boundaries.To distinguish it with the classic CVTs,we call it an Edge-Weighted CVT(EWCVT).The concept of EWCVT is expected to build a mathematical base for all CVT related data classifications with requirement of smoothness of the cluster boundaries.The EWCVT method is easy in implementation,fast in computation,and natural for any number of clusters. 展开更多
关键词 centroidal Voronoi tessellations cluster boundaD edge detection clustering image processing.
在线阅读 下载PDF
基于网格与域质心权重的自适应k-means聚类GDCW-AKM算法 被引量:3
2
作者 蔡巍 孙广宇 +2 位作者 杨飞 姚博 李传宪 《油气储运》 北大核心 2025年第5期581-589,共9页
【目的】根据物理实体构建的天然气管道数字孪生体会源源不断地产生大量数据,数据挖掘面临计算成本、效率及可扩展性等挑战。k-means聚类算法是应用最广泛的数据挖掘方法之一,但是需要指定簇数k,且初始质心的选择决定聚类的计算效率以... 【目的】根据物理实体构建的天然气管道数字孪生体会源源不断地产生大量数据,数据挖掘面临计算成本、效率及可扩展性等挑战。k-means聚类算法是应用最广泛的数据挖掘方法之一,但是需要指定簇数k,且初始质心的选择决定聚类的计算效率以及是否会陷入局部最优,这导致传统k-means算法处理大数据通常需要数分钟甚至更久,同时聚类结果不唯一,需要多次运行取最优结果。【方法】为满足管道数字孪生体对实时数据挖掘的需求,提出一种基于网格与域质心权重的自适应k-means聚类GDCW-AKM算法:①将数据集划分到大小一致的网格空间里,用网格空间的中心位置代替这个空间,空间内数据的数量作为权重赋予该点,得到样本集与权重集;②再次将样本集划分成多个域,把每个域的质心作为样本,域内数据的权重之和作为新的权重,得到新的样本集与权重集;③为每个样本赋予密度ρ与距离δ,令r=δ√ρ,根据r值对样本进行降序排序;④设置多组k值,选择前k个r对应的样本作为初始质心,聚类结果的方差比准则最大值对应的k与初始质心即为最佳簇数与最佳初始质心,该次聚类结果即最终结果。【结果】将GDCW-AKM算法应用于山东天然气管道公司某站场,通过运行时间以及多种内部评价指标评估该算法的性能。结果表明,该算法能够准确识别站场管道历史运行数据的工况数量,并能确切地将新增数据分配到所属工况类别,且在聚类精度达到k-means算法的99%以上的情况下后续计算效率大幅提高,数据量达到20×10^(4)时效率提高近12倍,数据量越大效率提升越明显。【结论】基于网格与域质心权重的自适应k-means聚类GDCW-AKM算法能充分满足站场管道数字孪生体对算法效率与精度的要求,可在站场大力推广应用。 展开更多
关键词 数字孪生 天然气管道 K-MEANS聚类 网格划分 最佳簇数 最佳初始质心
原文传递
基于k-means聚类熵权评价的飞行器质心调整优化方法
3
作者 田小川 郁立勇 +2 位作者 白斌 陈思 何文凯 《导弹与航天运载技术(中英文)》 北大核心 2025年第1期37-41,共5页
针对飞行器质心调整流程复杂、耗时长的问题,运用k-means聚类方法,对飞行器配重历史数据进行聚类,基于样本聚类结果,计算出不同样本下飞行器标准配重,再通过模拟装配计算增加标准配重后的飞行器质心偏移,并得出一系列统计数据,最后采用... 针对飞行器质心调整流程复杂、耗时长的问题,运用k-means聚类方法,对飞行器配重历史数据进行聚类,基于样本聚类结果,计算出不同样本下飞行器标准配重,再通过模拟装配计算增加标准配重后的飞行器质心偏移,并得出一系列统计数据,最后采用基于熵权的综合评价方法对比质心调整效果,选出最优的飞行器标准配重,进而简化飞行器质心调整流程,大幅提升飞行器生产效率。 展开更多
关键词 K-MEANS 熵权评价模型 飞行器质心调整 聚类
在线阅读 下载PDF
一种基于非线性表征和质心融合的模糊双中心聚类方法
4
作者 赵丹 宋燕 《电子科技》 2025年第7期15-23,共9页
针对非负不完整数据的高精度聚类问题,文中提出了一种创新模糊聚类方法。通过将非线性函数、实例频率正则化项和知识迁移引入到传统潜在因子模型来提升模型表征能力和数据填补精度,形成了非线性表征潜在因子模型。结合稀疏自表示和质心... 针对非负不完整数据的高精度聚类问题,文中提出了一种创新模糊聚类方法。通过将非线性函数、实例频率正则化项和知识迁移引入到传统潜在因子模型来提升模型表征能力和数据填补精度,形成了非线性表征潜在因子模型。结合稀疏自表示和质心融合项实现了在考虑全局特征的同时自动确定最优聚类数,构建了质心融合的模糊双中心聚类模型。在真实数据集和图片上的实验结果验证了基于非线性表征和质心融合的模糊双中心聚类方法在处理非负不完整数据的聚类问题上的有效性。 展开更多
关键词 不完整数据 非线性函数 潜在因子分析 实例频率 质心融合 模糊聚类 稀疏自表示 知识迁移
在线阅读 下载PDF
电力物资检测实验室重复需求数据分类挖掘
5
作者 李璐璐 董升 +1 位作者 张治 张奎 《计算机仿真》 2025年第12期109-113,共5页
电力物资检测实验室所产生的数据源于不同的系统与设备,具有异构性,且数据之间存在着复杂的非线性关系,使得提取并确定电力物资检测实验室重复数据的特征以及分类范围较为困难的,影响分类挖掘精准度。因此,展开电力物资检测实验室重复... 电力物资检测实验室所产生的数据源于不同的系统与设备,具有异构性,且数据之间存在着复杂的非线性关系,使得提取并确定电力物资检测实验室重复数据的特征以及分类范围较为困难的,影响分类挖掘精准度。因此,展开电力物资检测实验室重复需求数据分类挖掘研究。考虑数据存在异构性,计算电力初始数据的扩散模糊度,以依据各个数据之间模糊度的相似性来确定数据最中心的特征,实现对数据的整合。构建二次规划空间,将分类问题转化为数据的规划问题,并引入该空间内的分类面核函数,更好地把握数据之间的非线性关系,确定最优分类范围,以提升数据分类的精确性。最后运用K中心聚类算法查找相同维度的数据,依照最佳分类范围进行判定,实现电力物资检测实验室重复需求数据的分类挖掘。结果表明,所提方法可消除数据异构性带来的障碍,有效整合数据,并精准挖掘到相同需求数据,具有一定的实用价值。 展开更多
关键词 重复需求数据 扩散模糊度 最中心特征 分类面核函数 中心聚类
在线阅读 下载PDF
面向大数据处理的划分聚类新方法 被引量:22
6
作者 卢志茂 冯进玫 +2 位作者 范冬梅 杨朋 田野 《系统工程与电子技术》 EI CSCD 北大核心 2014年第5期1010-1015,共6页
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上... 大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上采用抽样后剩余数据样本对质心的初始位置进行更新,以便校正偏离理想位置的初始质心。该划分聚类算法具有线性空间复杂度和时间复杂度。实验结果表明所提的新聚类算法不仅能得到比常用聚类算法更理想的结果,而且运行速度快,适合处理大规模数据的聚类任务。 展开更多
关键词 大数据 物联网 划分聚类 抽样 质心
在线阅读 下载PDF
基于QPSO的数据聚类 被引量:14
7
作者 龙海侠 须文波 孙俊 《计算机应用研究》 CSCD 北大核心 2006年第12期40-42,45,共4页
在K-Means聚类、PSO聚类、K-Means和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用K-Means聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户... 在K-Means聚类、PSO聚类、K-Means和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用K-Means聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户指定的聚类个数的聚类中心。聚类过程都是根据数据之间的Euclidean(欧几里得)距离。K-Means算法、PSO算法和QPSO算法的不同在于聚类中心向量的“进化”上。最后使用三个数据集比较了上面提到的五种聚类方法的性能,结果显示基于QPSO算法的数据聚类性能比一般PSO算法更好。 展开更多
关键词 聚类 K—Means PSO QPSO 聚类中心
在线阅读 下载PDF
一种基于PSO的模糊聚类算法 被引量:9
8
作者 冯征 阎敏 张智峰 《计算机工程与应用》 CSCD 北大核心 2006年第27期150-151,165,共3页
在大量的模糊聚类算法中,模糊C均值聚类算法是应用最为广泛的,然而它存在着一些缺点:对初始值敏感,对噪声数据敏感,容易陷入局部最优。针对以上问题,提出了一种基于粒子群优化的模糊聚类算法,利用粒子群强大的全局寻优能力,这种算法克... 在大量的模糊聚类算法中,模糊C均值聚类算法是应用最为广泛的,然而它存在着一些缺点:对初始值敏感,对噪声数据敏感,容易陷入局部最优。针对以上问题,提出了一种基于粒子群优化的模糊聚类算法,利用粒子群强大的全局寻优能力,这种算法克服了模糊C均值聚类算法的缺点,试验证明,这种算法是一种很有潜力的模糊聚类算法。 展开更多
关键词 粒子群优化 模糊聚类 模糊C均值算法 簇中心
在线阅读 下载PDF
基于全局性确定聚类中心的文本聚类 被引量:5
9
作者 陈建超 胡桂武 +1 位作者 杨志华 严桂夺 《计算机工程与应用》 CSCD 北大核心 2011年第10期147-150,共4页
文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算方法;在此基础上提... 文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算方法;在此基础上提出了改进的CBC算法,从全局上自适应地确定文本集中的各个聚类中心。算法在实验中准确地确定了各个聚类中心,并在两个文本集上分别获得88.50%和94.00%的聚类准确率。 展开更多
关键词 文本聚类 全局性 聚类质心 特征词集
在线阅读 下载PDF
基于最小聚类划分的K-means聚类(1+ε)近似算法 被引量:5
10
作者 王守强 朱大铭 史士英 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期26-30,共5页
k-means聚类算法是解决聚类问题的一个常用方法.近年来,国外许多学者对该问题的近似常数算法和(1+ε)近似算法进行了研究.利用Kumar等人随机取样技术对于基于最小聚类划分k-means提出一个(1+ε)随机近似算法.该算法利用随机取样技术从... k-means聚类算法是解决聚类问题的一个常用方法.近年来,国外许多学者对该问题的近似常数算法和(1+ε)近似算法进行了研究.利用Kumar等人随机取样技术对于基于最小聚类划分k-means提出一个(1+ε)随机近似算法.该算法利用随机取样技术从集合中求出部分取样点,再对随机取样点进行组合找出每个聚类的部分点,将该部分点的质心点作为相应子聚类簇的质心点.通过多次运行该算法可以以较高概率求出k-means聚类的1+ε近似值. 展开更多
关键词 K-MEANS 聚类 质心点 ε质心点
在线阅读 下载PDF
基于泛化中心聚类的不完备数据集填补方法 被引量:11
11
作者 王妍 王凤桐 +2 位作者 王俊陆 宋宝燕 石展 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2017-2021,共5页
随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统... 随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现. 展开更多
关键词 海量数据 不完备数据集 泛化中心聚类 数据损坏度
在线阅读 下载PDF
基于成对约束的判别型半监督聚类分析 被引量:52
12
作者 尹学松 胡思良 陈松灿 《软件学报》 EI CSCD 北大核心 2008年第11期2791-2802,共12页
现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投... 现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投影空间中使用基于成对约束的K均值算法对数据聚类,再利用聚类结果选择投影空间.同时,该算法降低了基于约束的半监督聚类算法的计算复杂度,并解决了聚类过程中成对约束的违反问题.在一组真实数据集上的实验结果表明,与现有相关半监督聚类算法相比,新方法不仅能够处理高维数据,还有效地提高了聚类性能. 展开更多
关键词 半监督聚类 成对约束 闭包中心 投影矩阵 聚类分析
在线阅读 下载PDF
一种基于双重距离尺度的高维索引结构 被引量:3
13
作者 庄毅 翁建广 +1 位作者 庄越挺 吴飞 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第3期380-385,共6页
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于... 为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构,对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离,并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明,该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询. 展开更多
关键词 K近邻查询 类超球 质心距离 始点距离
在线阅读 下载PDF
基于加权聚类质心的SVM不平衡分类方法 被引量:4
14
作者 胡小生 钟勇 《智能系统学报》 CSCD 北大核心 2013年第3期261-265,共5页
不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚... 不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚类内样本分布和数量,相等类别数量的质心和权重因子参与SVM模型训练.实验结果表明,该方法使模型的训练样本具有较高的代表性,分类性能与其他采样方法相比得到了提升. 展开更多
关键词 机器学习 不平衡数据分类 聚类质心 支持向量机
在线阅读 下载PDF
基于双簇头聚类分簇和数据融合的无线传感器网络路由算法 被引量:10
15
作者 刘壮 冯欣 +3 位作者 王雁龙 李腾 张晶晶 杨文龙 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第5期1013-1017,共5页
针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地... 针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地均摊能量消耗,提高了分簇均匀性.仿真实验结果表明,该算法降低了网络能耗,提升了网络生命周期. 展开更多
关键词 无线传感器网络 低能量自适应聚类层次(LEACH) 聚类 数据融合 质心
在线阅读 下载PDF
基于聚类数和初始值的K-means算法改进研究 被引量:6
16
作者 屈新怀 高万里 +1 位作者 丁必荣 李朕 《组合机床与自动化加工技术》 北大核心 2011年第4期42-46,共5页
原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质... 原始的K-means算法,随机生成初始质心,事先给定聚类数k,在该前提下进行聚类,大大降低了聚类的效果。文章是对原始K-means算法的改进,提出了一种基于密度选取初始质心和采取遗传算法优化聚类数k的算法。该算法在一定程度上解决了初始质心和聚类数k对聚类精度和效率的影响,提高了聚类的准确率。最后文章通过实验证明了改进算法的有效性。 展开更多
关键词 K-MEANS算法 初始质心 聚类数k
在线阅读 下载PDF
k-means聚类问题的改进近似算法 被引量:2
17
作者 王守强 朱大铭 史士英 《山东大学学报(工学版)》 CAS 北大核心 2011年第4期125-132,共8页
研究了Ostrovsky给出k-means问题的(1+ε)-近似算法,针对算法中取样参数小的以及枚举数量大的不足,证明了可以选择一个更大的取样参数减小取样点集,基于随机算法,提出新的枚举策略减少枚举数量。本文分析了算法的成功概率。改进算法的... 研究了Ostrovsky给出k-means问题的(1+ε)-近似算法,针对算法中取样参数小的以及枚举数量大的不足,证明了可以选择一个更大的取样参数减小取样点集,基于随机算法,提出新的枚举策略减少枚举数量。本文分析了算法的成功概率。改进算法的期望时间复杂度为O(2O(kα2/ε)dn),其中d、n分别为问题实例的空间维数和输入点个数,α是小于1的分隔系数。算法的成功概率为121-e-21εk(1-O(α))。与Ostrovsky给出的算法相比,算法的运算效率得到很大的提高。 展开更多
关键词 算法 聚类 概率 质心点
原文传递
基于样本密度的FCM改进算法 被引量:12
18
作者 黎俊锋 朱锋峰 《科学技术与工程》 2007年第4期636-638,共3页
从聚类中心的直观属性出发,选取样本中密度较大的点作为FCM算法的初始聚类中心。解决了FCM算法对初始值敏感、收敛结果容易陷入局部极小等问题。实验结果证明这一算法的合理性和有效性。
关键词 FCM算法 聚类中心 样本密度
在线阅读 下载PDF
基于Hyperlink聚类的网页分类研究 被引量:1
19
作者 叶卫国 卢正鼎 王天江 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期5-6,31,共3页
研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用... 研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用于Web文档信息分类 ,比传统的文本分类方法更加有效 . 展开更多
关键词 网页分类 超链接 聚类 中心点
在线阅读 下载PDF
一种DBSCAN聚类点密度的加权质心定位算法 被引量:5
20
作者 李轶 张亮 +1 位作者 张然 张申 《河南科技大学学报(自然科学版)》 CAS 北大核心 2018年第2期36-39,47,共5页
加权质心定位算法是无线传感器网络中最常用的定位算法,为了进一步提高其定位精度,本文将聚类算法引入到无线传感器网络定位中,提出了一种具有噪声的基于密度的聚类算法(DBSCAN)聚类点密度的加权质心定位算法。该算法根据共线度理论选... 加权质心定位算法是无线传感器网络中最常用的定位算法,为了进一步提高其定位精度,本文将聚类算法引入到无线传感器网络定位中,提出了一种具有噪声的基于密度的聚类算法(DBSCAN)聚类点密度的加权质心定位算法。该算法根据共线度理论选择参数,构建定位三角形的集合。选择集合中定位效果较好的一部分三角形对未知节点进行定位,并对所得的初始定位结果进行DBSCAN聚类。在排除误差较大的定位坐标后,将聚类后每个簇的核心点个数视为权值,采用加权质心定位算法得到未知节点的最终定位位置。仿真结果表明:该算法与传统加权质心定位算法相比,平均定位误差减小80%以上,有效提高了无线传感器网络定位精度。 展开更多
关键词 无线传感器网络 聚类 DBSCAN 加权质心定位算法 共线度
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部