期刊文献+
共找到3,803篇文章
< 1 2 191 >
每页显示 20 50 100
ALLIED FUZZY c-MEANS CLUSTERING MODEL 被引量:2
1
作者 武小红 周建江 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2006年第3期208-213,共6页
A novel model of fuzzy clustering, i.e. an allied fuzzy c means (AFCM) model is proposed based on the combination of advantages of fuzzy c means (FCM) and possibilistic c means (PCM) clustering. PCM is sensitive... A novel model of fuzzy clustering, i.e. an allied fuzzy c means (AFCM) model is proposed based on the combination of advantages of fuzzy c means (FCM) and possibilistic c means (PCM) clustering. PCM is sensitive to initializations and often generates coincident clusters. AFCM overcomes this shortcoming and it is an ex tension of PCM. Membership and typicality values can be simultaneously produced in AFCM. Experimental re- suits show that noise data can be well processed, coincident clusters are avoided and clustering accuracy is better. 展开更多
关键词 fuzzy c-means clustering possibilistic c means clustering allied fuzzy c-means clustering
在线阅读 下载PDF
基于Canopy-K means聚类的高速ETC用户价值识别研究 被引量:1
2
作者 李忠锐 代洪娜 +2 位作者 范宏贤 宋庆祥 赵欢欢 《交通与运输》 2025年第3期6-10,共5页
针对高速公路ETC用户价值细分问题,结合大数据挖掘技术,构建一种基于改进无监督聚类的用户价值分层识别模型。利用高速公路ETC收费数据,结合改进的RFM客户细分模型,运用Canopy-K means聚类将不同车型的高速公路ETC用户进行分类;基于出... 针对高速公路ETC用户价值细分问题,结合大数据挖掘技术,构建一种基于改进无监督聚类的用户价值分层识别模型。利用高速公路ETC收费数据,结合改进的RFM客户细分模型,运用Canopy-K means聚类将不同车型的高速公路ETC用户进行分类;基于出行行为特征构建客户画像;对每一类群体特征进行归纳总结;结合客户价值逐一分析客户偏好及需求。结果表明:采用聚类方法对四类车型分类得出4种用户群体;根据聚类将用户分为黄金、白银及普通用户,并针对不同种类ETC用户确定客户画像及应对策略。 展开更多
关键词 机器学习 Canopy-K means聚类 高速ETC收费数据 用户识别 用户价值
在线阅读 下载PDF
基于k-means和半监督机制的单类中心学习算法 被引量:4
3
作者 李志圣 孙越恒 +1 位作者 何丕廉 侯越先 《计算机应用》 CSCD 北大核心 2008年第10期2513-2516,共4页
提出了一个基于k-means算法框架和半监督机制的single-means算法,以解决单类中心学习问题。k-means算法实质上是对一种混合高斯模型的期望最大化(EM)算法的近似,对该模型随机生成的多类混合数据集,从目标类中随机标定的初始中心出发,能... 提出了一个基于k-means算法框架和半监督机制的single-means算法,以解决单类中心学习问题。k-means算法实质上是对一种混合高斯模型的期望最大化(EM)算法的近似,对该模型随机生成的多类混合数据集,从目标类中随机标定的初始中心出发,能确定地收敛到该类的实际中心。将single-means算法应用到对单类文本中心学习问题中,实验结果表明:在给定目标类中的小标定文本集后,新算法能够有效地改进类的初始中心,且对数据稀疏和方差较大的实际问题具有健壮性。 展开更多
关键词 K-means 单类学习 半监督学习 single—means
在线阅读 下载PDF
基于MPE和改进K⁃means算法的分接开关机械故障诊断方法 被引量:15
4
作者 马宏忠 徐艳 魏海增 《高压电器》 CAS CSCD 北大核心 2020年第8期198-204,共7页
随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的... 随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的不同机械故障,采集振动信号;其次,为实现非线性振动信号下OLTC的故障诊断,采用多尺度排列熵(MPE)进行OLTC机械故障状态的特征提取;再次,采用粒子群(PSO)优化的K⁃means聚类算法诊断OLTC机械故障;最后,将该方法用于OLTC的机械故障诊断,并与传统K⁃means算法以及BP网络的诊断效果进行对比。结果表明,提出的基于MPE和改进K⁃means算法适用于OLTC机械故障诊断,诊断效果优于传统K⁃means算法以及BP网络,且其稳定性较高。 展开更多
关键词 OLTC K⁃means算法 粒子群优化的K⁃means算法 多尺度排列熵
在线阅读 下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
5
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 聚类分析 K⁃means聚类算法 聚类中心选取 K⁃means算法改进 初始中心点
在线阅读 下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
6
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—means算法 初始聚类中心 直方图 最优划分方法
原文传递
K-means算法初始聚类中心选择的优化 被引量:52
7
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 聚类 初始聚类中心 TDKM算法
在线阅读 下载PDF
一种K-means改进算法的并行化实现与应用 被引量:52
8
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行K—means 文本聚类
在线阅读 下载PDF
K-means算法研究综述 被引量:173
9
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《现代图书情报技术》 CSSCI 北大核心 2011年第5期28-35,共8页
对聚类分析中的基本算法K-means算法中的K值确定、初始聚类中心选择以及分类属性数据处理等主要问题进行综述,理清K-means算法的整个发展脉络及算法研究中的热点和难点,提出改进K-means聚类算法的思路。
关键词 K—means算法 聚类算法 K值 初始聚类中心
原文传递
初始中心优化的K-Means聚类算法 被引量:47
10
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 K—means聚类算法 初始聚类中心 优化
在线阅读 下载PDF
Seismic random noise suppression using an adaptive nonlocal means algorithm 被引量:10
11
作者 尚帅 韩立国 +1 位作者 吕庆田 谭尘青 《Applied Geophysics》 SCIE CSCD 2013年第1期33-40,117,118,共10页
Nonlocal means filtering is a noise attenuation method based on redundancies in image information. It is also a nonlocal denoising method that uses the self-similarity of an image, assuming that the valid structures o... Nonlocal means filtering is a noise attenuation method based on redundancies in image information. It is also a nonlocal denoising method that uses the self-similarity of an image, assuming that the valid structures of the image have a certain degree of repeatability that the random noise lacks. In this paper, we use nonlocal means filtering in seismic random noise suppression. To overcome the problems caused by expensive computational costs and improper filter parameters, this paper proposes a block-wise implementation of the nonlocal means method with adaptive filter parameter estimation. Tests with synthetic data and real 2D post-stack seismic data demonstrate that the proposed algorithm better preserves valid seismic information and has a higher accuracy when compared with traditional seismic denoising methods (e.g., f-x deconvolution), which is important for subsequent seismic processing and interpretation. 展开更多
关键词 seismic prospecting ADAPTIVE nonlocal means random noise attenuation
在线阅读 下载PDF
初始化K-means的谱方法 被引量:32
12
作者 钱线 黄萱菁 吴立德 《自动化学报》 EI CSCD 北大核心 2007年第4期342-346,共5页
众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一... 众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一些初始化KM的方法. 展开更多
关键词 聚类 K—means算法 特征中心
在线阅读 下载PDF
基于优化粒子群K-means聚类算法在风功率预测中的应用 被引量:3
13
作者 郭敏 赵巧娥 +2 位作者 王先军 高金城 李昆 《自动化技术与应用》 2017年第8期24-26,39,共4页
由于风的间隙性、随机性、波动性很大,为了提高电网运行稳定性,有必要进行风功率预测。由于风电机组在实际当中运行受地理环境因素的限制,所以传统风电场建模进行风功率预测的方法不再适用,而通过K-means聚类算法求取风电机组的风速-功... 由于风的间隙性、随机性、波动性很大,为了提高电网运行稳定性,有必要进行风功率预测。由于风电机组在实际当中运行受地理环境因素的限制,所以传统风电场建模进行风功率预测的方法不再适用,而通过K-means聚类算法求取风电机组的风速-功率曲线虽然准确性有所提高,但由于k-means聚类中心随机选择,仍然存在很多缺陷。本文提出利用优化粒子群的K-means聚类算法进行风功率预测,通过仿真结果验证了利用优化粒子群的K-means聚类算法进行风功率预测的准确性要比传统的方法以及K-means聚类算法的准确性高。 展开更多
关键词 风功率 预测 K-means聚类算法 优化粒子群的K—means聚类算法
在线阅读 下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:18
14
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 K—means聚类改进 主题抽取 同义词替换 分词领域词典
在线阅读 下载PDF
自适应K-means聚类的散乱点云精简 被引量:21
15
作者 陈龙 蔡勇 张建生 《中国图象图形学报》 CSCD 北大核心 2017年第8期1089-1097,共9页
目的点云精简是曲面重建等点云处理的一个重要前提,针对以往散乱点云精简算法的精简结果存在失真较大、空洞及不适用于片状点云的问题,提出一种自适应K-means聚类的点云精简算法。方法首先,根据k邻域计算每个数据点的曲率、点法向与邻... 目的点云精简是曲面重建等点云处理的一个重要前提,针对以往散乱点云精简算法的精简结果存在失真较大、空洞及不适用于片状点云的问题,提出一种自适应K-means聚类的点云精简算法。方法首先,根据k邻域计算每个数据点的曲率、点法向与邻域点法向夹角的平均值、点到邻域重心的距离、点到邻域点的平均距离,据此运用多判别参数混合的特征提取方法识别并保留特征点,包括曲面尖锐点和边界点;然后,对点云数据建立自适应八叉树,为K-means聚类提供与点云密度分布相关的初始化聚类中心以及K值;最后,遍历整个聚类,如果聚类结果中含有特征点则剔除其中的特征点并更新聚类中心,计算更新后聚类中数据点的最大曲率差,将最大曲率差大于设定阈值的聚类进行细分,保留最终聚类中距聚类中心最近的数据点。结果在聚类方面,将传统的K-means聚类和自适应K-means聚类算法应用于bunny点云,后者在聚类的迭代次数、评价函数值和时间上均优于前者;在精简方面,将提出的精简算法应用于封闭及片状两种不同类型的点云,在精简比例为1/5时fandisk及saddle模型的精简误差分别为0.29×10^(-3)、-0.41×10^(-3)和0.037、-0.094,对于片状的saddle点云模型,其边界收缩误差为0.030 805,均小于栅格法和曲率法。结论本文提出的散乱点云精简算法可应用于封闭及片状点云,精简后的数据点分布均匀无空洞,对片状点云进行精简时能够保护模型的边界数据点。 展开更多
关键词 点云精简 八叉树 K—means聚类 片状点云 边界点
原文传递
一种分层自适应快速K-means算法 被引量:7
16
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFKM K—means算法 分层聚类 自适应 大数据库 聚类树
在线阅读 下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
17
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 K—means算法
原文传递
改进K-means算法的MapReduce并行化研究 被引量:7
18
作者 李兰英 董义明 +1 位作者 孔银 周秋丽 《哈尔滨理工大学学报》 CAS 北大核心 2016年第1期31-35,共5页
针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在Map... 针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快. 展开更多
关键词 聚类 MAPREDUCE K—means 加速比
在线阅读 下载PDF
基于模糊C-Means的改进型KNN分类算法 被引量:14
19
作者 朱付保 谢利杰 +1 位作者 汤萌萌 朱颢东 《华中师范大学学报(自然科学版)》 CAS 北大核心 2017年第6期754-759,共6页
KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对... KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对样本数据进行聚类处理,用形成的子簇代替该子簇所有的样本集,以减少训练集的数量,从而减少KNN分类过程的工作量、提高分类效率,使KNN算法更好地应用于数据挖掘.通过理论分析和实验结果表明,论文所提算法在面对较大数据时能有效提高算法的效率和精确性,满足处理数据的需求. 展开更多
关键词 模糊C—means 聚类 KNN分类
在线阅读 下载PDF
基于改进的模糊C-Means航迹聚类方法研究 被引量:19
20
作者 王超 王明明 王飞 《中国民航大学学报》 CAS 2013年第3期14-18,共5页
为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算... 为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算法得到航迹相似性矩阵,利用矩阵得到航迹簇,最后形成中心航迹,算例仿真验证了新算法的有效性。 展开更多
关键词 航迹聚类 遗传模拟退火算法 模糊C—means 最长公共子序列
在线阅读 下载PDF
上一页 1 2 191 下一页 到第
使用帮助 返回顶部