期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
Modelling the Survival of Western Honey Bee Apis mellifera and the African Stingless Bee Meliponula ferruginea Using Semiparametric Marginal Proportional Hazards Mixture Cure Model
1
作者 Patience Isiaho Daisy Salifu +1 位作者 Samuel Mwalili Henri E. Z. Tonnang 《Journal of Data Analysis and Information Processing》 2024年第1期24-39,共16页
Classical survival analysis assumes all subjects will experience the event of interest, but in some cases, a portion of the population may never encounter the event. These survival methods further assume independent s... Classical survival analysis assumes all subjects will experience the event of interest, but in some cases, a portion of the population may never encounter the event. These survival methods further assume independent survival times, which is not valid for honey bees, which live in nests. The study introduces a semi-parametric marginal proportional hazards mixture cure (PHMC) model with exchangeable correlation structure, using generalized estimating equations for survival data analysis. The model was tested on clustered right-censored bees survival data with a cured fraction, where two bee species were subjected to different entomopathogens to test the effect of the entomopathogens on the survival of the bee species. The Expectation-Solution algorithm is used to estimate the parameters. The study notes a weak positive association between cure statuses (ρ1=0.0007) and survival times for uncured bees (ρ2=0.0890), emphasizing their importance. The odds of being uncured for A. mellifera is higher than the odds for species M. ferruginea. The bee species, A. mellifera are more susceptible to entomopathogens icipe 7, icipe 20, and icipe 69. The Cox-Snell residuals show that the proposed semiparametric PH model generally fits the data well as compared to model that assume independent correlation structure. Thus, the semi parametric marginal proportional hazards mixture cure is parsimonious model for correlated bees survival data. 展开更多
关键词 Mixture cure Models clustered Survival Data Correlation Structure Cox-Snell Residuals EM algorithm Expectation-Solution algorithm
暂未订购
引入信息熵的CURE聚类算法 被引量:14
2
作者 伍恒 李文杰 蒋旻 《计算机应用研究》 CSCD 北大核心 2017年第8期2303-2305,共3页
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数... 为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。 展开更多
关键词 层次聚类 cure算法 信息熵 代表点选取
在线阅读 下载PDF
Binary-Positive下的并行化CURE算法 被引量:3
3
作者 王民 尹超 +2 位作者 王稚慧 要趁红 高婧 《计算机工程与应用》 CSCD 2014年第11期58-61,共4页
当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效... 当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。 展开更多
关键词 聚类 利用代表点聚类(cure) Binary—Positive MAPREDUCE 并行
在线阅读 下载PDF
基于CURE的用户聚类算法研究 被引量:8
4
作者 赵妍 赵学民 《计算机工程与应用》 CSCD 2012年第11期97-101,共5页
通过对Web网站的日志进行聚类分析,目的是获取用户兴趣访问模式,进而为不同用户群体提供定制的个性化服务。针对原始CURE算法在代表点选择的随机性、不能充分体现用户兴趣偏好方面存在的问题,提出了改进的用户聚类算法,根据用户兴趣的... 通过对Web网站的日志进行聚类分析,目的是获取用户兴趣访问模式,进而为不同用户群体提供定制的个性化服务。针对原始CURE算法在代表点选择的随机性、不能充分体现用户兴趣偏好方面存在的问题,提出了改进的用户聚类算法,根据用户兴趣的显著特征提取元素的主要属性进行预聚类,为小类合并提供合理的初始类集,实验结果证明了该方法有较好的聚类结果。 展开更多
关键词 利用代表点聚类(cure)算法 聚类分析 用户兴趣 个性化
在线阅读 下载PDF
基于改进CURE算法的不确定性移动用户数据聚类 被引量:8
5
作者 高长元 王海晶 王京 《计算机工程与科学》 CSCD 北大核心 2016年第4期768-774,共7页
随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理... 随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。 展开更多
关键词 cure 不确定性数据 移动用户数据 Map REDUCE
在线阅读 下载PDF
增量式CURE聚类算法研究 被引量:9
6
作者 冯兴杰 黄亚楼 《小型微型计算机系统》 CSCD 北大核心 2004年第10期1847-1849,共3页
聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的... 聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 . 展开更多
关键词 数据挖掘 cure聚类算法 最近邻 增量式聚类算法
在线阅读 下载PDF
基于CURE聚类优化的数据挖掘算法研究 被引量:3
7
作者 郑志娴 吴为民 李慧敏 《哈尔滨商业大学学报(自然科学版)》 CAS 2017年第6期723-727,共5页
以海量非结构化数据为研究对象,在已有聚类算法研究基础上,从数据的获取与预处理,到数据聚类,再到数据的个性化管理全过程进行分析,针对数据聚类过程中的计算量庞大和复杂程度高的现状对已有CURE聚类算法进行优化,尽可能的最大程度提高... 以海量非结构化数据为研究对象,在已有聚类算法研究基础上,从数据的获取与预处理,到数据聚类,再到数据的个性化管理全过程进行分析,针对数据聚类过程中的计算量庞大和复杂程度高的现状对已有CURE聚类算法进行优化,尽可能的最大程度提高数据聚类效率,进而提高大数据挖掘水平,为大数据应用提供更好的服务.通过以某通信企业不断变化的用户数据为分析对象,证明此次基于CURE聚类算法优化的数据挖掘算法有效性,结果表明CURE聚类算法优化具有一定的可用性和实用性. 展开更多
关键词 数据挖掘 非结构化数据 数据聚类 cure聚类算法
在线阅读 下载PDF
一种改进的CURE聚类算法 被引量:4
8
作者 郭俊 樊彦国 《内蒙古石油化工》 CAS 2005年第8期12-15,共4页
聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自... 聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自动分离子类的方法,因而不用预先给定聚类个数;在CURE对原始数据进行随机采样和分区聚类的基础上,增加了划分网格一步,能降低噪声影响并缩短聚类时间。对二维数据的测试表明:改进的CURE能正确识别大多数类,速度上优于原算法。 展开更多
关键词 数据挖掘 层次聚类 代表对象 聚类算法 大规模数据库 聚类分析 统计特征 自动分离 随机采样 原始数据
在线阅读 下载PDF
一种改进的CURE聚类算法
9
作者 郭俊 樊彦国 《内蒙古石油化工》 CAS 2005年第4期14-17,共4页
聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自... 聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自动分离子类的方法,因而不用预先给定聚类个数;在CURE对原始数据进行随机采样和分区聚类的基础上,增加了划分网格一步,能降低噪声影响并缩短聚类时间。对二维数据的测试表明:改进的CURE能正确识别大多数类,速度上优于原算法。 展开更多
关键词 聚类算法 大规模数据库 研究方向 数据挖掘 聚类分析 统计特征 自动分离 随机采样 原始数据 噪声影响 二维数据 代表点 近距离 子类 网格
在线阅读 下载PDF
基于改进CURE聚类算法的网络用户异常行为识别方法 被引量:2
10
作者 许馨元 李越鹏 王媛媛 《微型电脑应用》 2023年第5期174-177,181,共5页
由于传统异常行为识别方法无法对随时变化的异常行为实现精准识别,因此对CURE聚类算法作出改进,针对网络用户异常行为提出了一种新的识别方法。通过改进CURE聚类算法将用户的上网行为分为正常行为簇和异常行为簇,标记正常行为簇,并利用... 由于传统异常行为识别方法无法对随时变化的异常行为实现精准识别,因此对CURE聚类算法作出改进,针对网络用户异常行为提出了一种新的识别方法。通过改进CURE聚类算法将用户的上网行为分为正常行为簇和异常行为簇,标记正常行为簇,并利用超矩形建模方式识别数据,分析正常行为簇在每个维度上的正常值域,判断其是否包含在所建立的超矩形内。如果在判定用户行为为正常,反之判断其为异常行为。仿真实验选取了学生上网行为数据,分四个时间段注入异常行为数据,结果表明,所提方法识别结果与设定情况一致,没有出现误识别或不识别现象,改进CURE聚类算法的网络用户异常行为识别精度较高,而且具有超高的效率。 展开更多
关键词 改进cure聚类算法 注入异常数据 超矩形建模 识别模型 正常行为
在线阅读 下载PDF
基于MapReduce的网格化优化CURE算法的实现
11
作者 郎福通 王鹏 《成都信息工程学院学报》 2014年第6期603-608,共6页
针对CURE算法处理大量数据时聚类速度较慢的问题,一方面采用网格聚类方法对初始聚类对象进行网格预聚类处理,缩短初始化族聚类时间;另一方面采用MapReduce框架对算法进行并行性扩展,使其能够充分利用集群的计算和存储能力,从而加速海量... 针对CURE算法处理大量数据时聚类速度较慢的问题,一方面采用网格聚类方法对初始聚类对象进行网格预聚类处理,缩短初始化族聚类时间;另一方面采用MapReduce框架对算法进行并行性扩展,使其能够充分利用集群的计算和存储能力,从而加速海量数据的处理。以联合程序开发网站的数据集和MATLAB人工数据集作为测试数据集,对改进算法Grid-CURE进行实验分析。实验结果表明:方法可有效提升处理大数据的效率以及提升其抗噪声能力。 展开更多
关键词 cure算法 网格聚类 MAPREDUCE 分布式聚类 Grid-cure算法
在线阅读 下载PDF
一种改进的CURE的事件聚类方法
12
作者 李静月 徐济成 朱昊 《重庆文理学院学报(社会科学版)》 2015年第5期121-124,共4页
一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验... 一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验结果表明:改进后的方法在保证执行效率的情况下取得了更好的聚类效果. 展开更多
关键词 层次聚类 cure 代表点 事件聚类
在线阅读 下载PDF
基于CURE聚类算法的区域滑坡敏感性评价研究
13
作者 戴俊威 MWAKAPESA Deborah Simon 《韶关学院学报》 2023年第12期31-35,共5页
针对现有基于聚类算法的滑坡敏感性评价模型存在难以设置参数等问题,采用CURE(Clustering using representative)聚类算法建立区域滑坡敏感性评价模型,并对延安宝塔区进行评价.实验结果表明,评价结果与实际一致,并且准确度比KPSO(K-mean... 针对现有基于聚类算法的滑坡敏感性评价模型存在难以设置参数等问题,采用CURE(Clustering using representative)聚类算法建立区域滑坡敏感性评价模型,并对延安宝塔区进行评价.实验结果表明,评价结果与实际一致,并且准确度比KPSO(K-means+particle swam opimization)模型高出17.2%,证明该模型的有效性,可为防灾减灾提供理论支撑. 展开更多
关键词 滑坡敏感性评价 聚类算法 cure K-MEANS
在线阅读 下载PDF
FDBSCAN:一种快速 DBSCAN算法(英文) 被引量:42
14
作者 周水庚 周傲英 +2 位作者 金文 范晔 钱卫宁 《软件学报》 EI CSCD 北大核心 2000年第6期735-744,共10页
聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输... 聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输入一个参数 ,DBSCAN算法就能够发现任意形状的类 ,并可以有效地处理噪声 .文章提出了一种加快 DBSCAN算法的方法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 .实验结果表明 ,FDBSCAN能够有效地对大规模数据库进行聚类 ,速度上数倍于 DBSCAN. 展开更多
关键词 大规模数据库 数据挖掘 聚类 快速DBSCAN算法 代表点
在线阅读 下载PDF
一种基于密度的快速聚类算法 被引量:90
15
作者 周水庚 周傲英 +1 位作者 曹晶 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2000年第11期1287-1292,共6页
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了... 聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 . 展开更多
关键词 数据挖掘 聚类 密度 快速算法 数据库
在线阅读 下载PDF
一种基于划分的层次聚类算法 被引量:13
16
作者 沈洁 赵雷 +1 位作者 杨季文 李榕 《计算机工程与应用》 CSCD 北大核心 2007年第31期175-177,共3页
CURE算法是针对大规模数据聚类算法的典型代表。提出了一种新的算法K-CURE,该方法基于划分思想对CURE算法作了改进,同时给出了在聚类中剔除孤立点的时机选择方法。测试表明,改进后的算法效率明显高于原算法,且聚类效果良好。
关键词 数据挖掘 层次聚类 代表对象 cure 孤立点
在线阅读 下载PDF
面向图表示社区检测的新型聚类覆盖算法 被引量:6
17
作者 陈洁 李锐 +1 位作者 赵姝 张燕平 《电子学报》 EI CAS CSCD 北大核心 2020年第9期1680-1687,共8页
图表示社区检测使用图表示方法学习网络节点的向量表示,然后对节点向量进行聚类获得社团结构.然而经典的聚类算法在聚类节点向量时,得到的结果往往不能够体现社区的特性.提出一种新型的聚类覆盖算法,将聚类所得覆盖视为社区划分结果.首... 图表示社区检测使用图表示方法学习网络节点的向量表示,然后对节点向量进行聚类获得社团结构.然而经典的聚类算法在聚类节点向量时,得到的结果往往不能够体现社区的特性.提出一种新型的聚类覆盖算法,将聚类所得覆盖视为社区划分结果.首先在节点向量空间中计算得到每个簇的覆盖中心;然后根据覆盖中心到同类样本的平均距离作为覆盖半径,在向量空间中形成覆盖;最后对未覆盖的点做二次划分得到社区结构.在多个有真实和无真实标签网络的实验表明,所提出的算法可以得到更合理的社区结果. 展开更多
关键词 社区发现 图表示 聚类 覆盖算法
在线阅读 下载PDF
一种基于层次聚类的机场噪声数据挖掘方法 被引量:12
18
作者 徐涛 谢继文 杨国庆 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2013年第5期715-721,共7页
针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚... 针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚类结果进行评价。实验结果表明,该算法不仅运行效率高,而且能够较准确地发现特定类型飞行事件的噪声分布模式,利用该分布模式能够较准确地预测特定类型飞行事件的噪声分布状况。 展开更多
关键词 数据挖掘 机场噪声预测 代表点 快速层次聚类算法 聚类结果评价
在线阅读 下载PDF
基于相异性选择的密度聚类算法研究 被引量:2
19
作者 胡文瑜 孙志挥 周晓云 《小型微型计算机系统》 CSCD 北大核心 2006年第9期1601-1604,共4页
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算法(EOptiSim),由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用OptiSim或EOptiSim多样化代表性子集选择... 在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算法(EOptiSim),由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用OptiSim或EOptiSim多样化代表性子集选择技术,在显著降低I/O耗费和内存需求的同时,不仅能够有效地聚类单一的大规模空间数据库,而且还能聚类大规模组合数据库或分布式数据库.实验结果表明本文的算法是可行、有效的. 展开更多
关键词 聚类分析 多样化代表性子集选择 相异性选择算法 密度聚类算法
在线阅读 下载PDF
基于最优K相异性的密度聚类算法研究 被引量:2
20
作者 胡文瑜 孙志挥 周晓云 《计算机工程与应用》 CSCD 北大核心 2005年第22期171-173,201,共4页
该文提出一种利用最优K相异性算法(OptiSim)的密度聚类算法,通过代表性子集选择技术与DBSCAN算法的结合,可显著降低I/O耗费和内存需求,使之能够有效地处理大规模空间数据库,并提出一种扩展的OptiSim代表性子集选择方法(EOptiSim),它在... 该文提出一种利用最优K相异性算法(OptiSim)的密度聚类算法,通过代表性子集选择技术与DBSCAN算法的结合,可显著降低I/O耗费和内存需求,使之能够有效地处理大规模空间数据库,并提出一种扩展的OptiSim代表性子集选择方法(EOptiSim),它在处理组合数据库方面能弥补基本的OptiSim方法的不足。实验结果表明文章的算法是可行、有效的。 展开更多
关键词 聚类分析 代表性子集选择 密度聚类算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部