期刊文献+
共找到3,805篇文章
< 1 2 191 >
每页显示 20 50 100
基于Canopy-K means聚类的高速ETC用户价值识别研究 被引量:1
1
作者 李忠锐 代洪娜 +2 位作者 范宏贤 宋庆祥 赵欢欢 《交通与运输》 2025年第3期6-10,共5页
针对高速公路ETC用户价值细分问题,结合大数据挖掘技术,构建一种基于改进无监督聚类的用户价值分层识别模型。利用高速公路ETC收费数据,结合改进的RFM客户细分模型,运用Canopy-K means聚类将不同车型的高速公路ETC用户进行分类;基于出... 针对高速公路ETC用户价值细分问题,结合大数据挖掘技术,构建一种基于改进无监督聚类的用户价值分层识别模型。利用高速公路ETC收费数据,结合改进的RFM客户细分模型,运用Canopy-K means聚类将不同车型的高速公路ETC用户进行分类;基于出行行为特征构建客户画像;对每一类群体特征进行归纳总结;结合客户价值逐一分析客户偏好及需求。结果表明:采用聚类方法对四类车型分类得出4种用户群体;根据聚类将用户分为黄金、白银及普通用户,并针对不同种类ETC用户确定客户画像及应对策略。 展开更多
关键词 机器学习 Canopy-K means聚类 高速ETC收费数据 用户识别 用户价值
在线阅读 下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
2
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—means算法 初始聚类中心 直方图 最优划分方法
原文传递
K-means算法初始聚类中心选择的优化 被引量:52
3
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 聚类 初始聚类中心 TDKM算法
在线阅读 下载PDF
一种K-means改进算法的并行化实现与应用 被引量:52
4
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行K—means 文本聚类
在线阅读 下载PDF
K-means算法研究综述 被引量:173
5
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《现代图书情报技术》 CSSCI 北大核心 2011年第5期28-35,共8页
对聚类分析中的基本算法K-means算法中的K值确定、初始聚类中心选择以及分类属性数据处理等主要问题进行综述,理清K-means算法的整个发展脉络及算法研究中的热点和难点,提出改进K-means聚类算法的思路。
关键词 K—means算法 聚类算法 K值 初始聚类中心
原文传递
初始中心优化的K-Means聚类算法 被引量:47
6
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 K—means聚类算法 初始聚类中心 优化
在线阅读 下载PDF
Seismic random noise suppression using an adaptive nonlocal means algorithm 被引量:10
7
作者 尚帅 韩立国 +1 位作者 吕庆田 谭尘青 《Applied Geophysics》 SCIE CSCD 2013年第1期33-40,117,118,共10页
Nonlocal means filtering is a noise attenuation method based on redundancies in image information. It is also a nonlocal denoising method that uses the self-similarity of an image, assuming that the valid structures o... Nonlocal means filtering is a noise attenuation method based on redundancies in image information. It is also a nonlocal denoising method that uses the self-similarity of an image, assuming that the valid structures of the image have a certain degree of repeatability that the random noise lacks. In this paper, we use nonlocal means filtering in seismic random noise suppression. To overcome the problems caused by expensive computational costs and improper filter parameters, this paper proposes a block-wise implementation of the nonlocal means method with adaptive filter parameter estimation. Tests with synthetic data and real 2D post-stack seismic data demonstrate that the proposed algorithm better preserves valid seismic information and has a higher accuracy when compared with traditional seismic denoising methods (e.g., f-x deconvolution), which is important for subsequent seismic processing and interpretation. 展开更多
关键词 seismic prospecting ADAPTIVE nonlocal means random noise attenuation
在线阅读 下载PDF
初始化K-means的谱方法 被引量:32
8
作者 钱线 黄萱菁 吴立德 《自动化学报》 EI CSCD 北大核心 2007年第4期342-346,共5页
众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一... 众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一些初始化KM的方法. 展开更多
关键词 聚类 K—means算法 特征中心
在线阅读 下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:18
9
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 K—means聚类改进 主题抽取 同义词替换 分词领域词典
在线阅读 下载PDF
自适应K-means聚类的散乱点云精简 被引量:21
10
作者 陈龙 蔡勇 张建生 《中国图象图形学报》 CSCD 北大核心 2017年第8期1089-1097,共9页
目的点云精简是曲面重建等点云处理的一个重要前提,针对以往散乱点云精简算法的精简结果存在失真较大、空洞及不适用于片状点云的问题,提出一种自适应K-means聚类的点云精简算法。方法首先,根据k邻域计算每个数据点的曲率、点法向与邻... 目的点云精简是曲面重建等点云处理的一个重要前提,针对以往散乱点云精简算法的精简结果存在失真较大、空洞及不适用于片状点云的问题,提出一种自适应K-means聚类的点云精简算法。方法首先,根据k邻域计算每个数据点的曲率、点法向与邻域点法向夹角的平均值、点到邻域重心的距离、点到邻域点的平均距离,据此运用多判别参数混合的特征提取方法识别并保留特征点,包括曲面尖锐点和边界点;然后,对点云数据建立自适应八叉树,为K-means聚类提供与点云密度分布相关的初始化聚类中心以及K值;最后,遍历整个聚类,如果聚类结果中含有特征点则剔除其中的特征点并更新聚类中心,计算更新后聚类中数据点的最大曲率差,将最大曲率差大于设定阈值的聚类进行细分,保留最终聚类中距聚类中心最近的数据点。结果在聚类方面,将传统的K-means聚类和自适应K-means聚类算法应用于bunny点云,后者在聚类的迭代次数、评价函数值和时间上均优于前者;在精简方面,将提出的精简算法应用于封闭及片状两种不同类型的点云,在精简比例为1/5时fandisk及saddle模型的精简误差分别为0.29×10^(-3)、-0.41×10^(-3)和0.037、-0.094,对于片状的saddle点云模型,其边界收缩误差为0.030 805,均小于栅格法和曲率法。结论本文提出的散乱点云精简算法可应用于封闭及片状点云,精简后的数据点分布均匀无空洞,对片状点云进行精简时能够保护模型的边界数据点。 展开更多
关键词 点云精简 八叉树 K—means聚类 片状点云 边界点
原文传递
一种分层自适应快速K-means算法 被引量:7
11
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFKM K—means算法 分层聚类 自适应 大数据库 聚类树
在线阅读 下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
12
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 K—means算法
原文传递
改进K-means算法的MapReduce并行化研究 被引量:7
13
作者 李兰英 董义明 +1 位作者 孔银 周秋丽 《哈尔滨理工大学学报》 CAS 北大核心 2016年第1期31-35,共5页
针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在Map... 针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快. 展开更多
关键词 聚类 MAPREDUCE K—means 加速比
在线阅读 下载PDF
基于模糊C-Means的改进型KNN分类算法 被引量:14
14
作者 朱付保 谢利杰 +1 位作者 汤萌萌 朱颢东 《华中师范大学学报(自然科学版)》 CAS 北大核心 2017年第6期754-759,共6页
KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对... KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对样本数据进行聚类处理,用形成的子簇代替该子簇所有的样本集,以减少训练集的数量,从而减少KNN分类过程的工作量、提高分类效率,使KNN算法更好地应用于数据挖掘.通过理论分析和实验结果表明,论文所提算法在面对较大数据时能有效提高算法的效率和精确性,满足处理数据的需求. 展开更多
关键词 模糊C—means 聚类 KNN分类
在线阅读 下载PDF
基于改进的模糊C-Means航迹聚类方法研究 被引量:19
15
作者 王超 王明明 王飞 《中国民航大学学报》 CAS 2013年第3期14-18,共5页
为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算... 为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算法得到航迹相似性矩阵,利用矩阵得到航迹簇,最后形成中心航迹,算例仿真验证了新算法的有效性。 展开更多
关键词 航迹聚类 遗传模拟退火算法 模糊C—means 最长公共子序列
在线阅读 下载PDF
基于小波变换和K-means的非结构化道路检测 被引量:11
16
作者 熊思 李磊民 黄玉清 《计算机工程》 CAS CSCD 2014年第2期158-161,共4页
道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基... 道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基于小波变换求模极大值的方法对滤波后的图像提取边缘,通过阈值法去除非道路边缘点,给出基于斜率和截距的K-means聚类算法,实现道路方程拟合。实验结果表明,与传统最小二乘法相比,该方法能在道路场景较为复杂的情况下更准确地实现非结构化道路检测,并提高实时性。 展开更多
关键词 道路检测 高斯金字塔 双边滤波 小波变换 模极大值 K—means聚类
在线阅读 下载PDF
模糊K-Harmonic Means聚类算法 被引量:6
17
作者 赵恒 杨万海 张高煜 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2005年第4期603-606,638,共5页
对K-HarmonicMeans算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-HarmonicMeans算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件... 对K-HarmonicMeans算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-HarmonicMeans算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件概率表达式以及在迭代过程中的数据加权函数表达式.最后,用Folkes&Mallows指标对聚类结果进行评价.实验表明,模糊K-HarmonicMeans(KHM)算法在聚类对于初值不敏感的同时提高了聚类结果的精确度,达到较好的聚类效果. 展开更多
关键词 模糊K—Harmonic means聚类 聚类中心 条件概率 Folkes & Mallows指标
在线阅读 下载PDF
结合X-means聚类的自适应随机子空间组合分类算法 被引量:5
18
作者 曹鹏 李博 +1 位作者 栗伟 赵大哲 《计算机应用》 CSCD 北大核心 2013年第2期550-553,共4页
针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空... 针对大规模数据的分类准确率低且效率下降的问题,提出一种结合X-means聚类的自适应随机子空间组合分类算法。首先使用X-means聚类方法,保持原有数据结构的同时,把复杂的数据空间自动分解为多个样本子空间进行分治学习;而自适应随机子空间组合分类器,提升了基分类器的差异性并自动确定基分类器数量,提升了组合分类器的鲁棒性及分类准确性。该算法在人工和UCI数据集上进行了测试,并与传统单分类和组合分类算法进行了比较。实验结果表明,对于大规模数据集,该方法具有更好的分类精度和健壮性,并提升了整体算法的效率。 展开更多
关键词 大规模数据集 X—means聚类 组合分类 随机子空间 支持向量机
在线阅读 下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
19
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 K—means算法 K值 初始聚类中心 同被引 文献聚类
在线阅读 下载PDF
基于模糊K-harmonic means的谱聚类算法 被引量:7
20
作者 汪中 刘贵全 陈恩红 《智能系统学报》 2009年第2期95-99,共5页
谱聚类作为一种有效的方法广泛应用于机器学习.通过分析谱聚类初始化敏感的实质,引入对初值不敏感的模糊K-harmonic means算法来克服这一缺点,提出一种基于模糊K-harmonic means的谱聚类算法(FKHM-SC).与传统谱聚类算法以及对初值敏感的... 谱聚类作为一种有效的方法广泛应用于机器学习.通过分析谱聚类初始化敏感的实质,引入对初值不敏感的模糊K-harmonic means算法来克服这一缺点,提出一种基于模糊K-harmonic means的谱聚类算法(FKHM-SC).与传统谱聚类算法以及对初值敏感的K-means、FCM算法相比,改进算法不仅可以识别有挑战性的人工数据,并且可以得到稳定的聚类中心和聚类结果,同时提高了聚类的精确度.实验结果表明了该算法的有效性和可行性. 展开更多
关键词 谱聚类 模糊K-harmonic means 初始化敏感 聚类中心
在线阅读 下载PDF
上一页 1 2 191 下一页 到第
使用帮助 返回顶部