期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
LeaDen-Stream: A Leader Density-Based Clustering Algorithm over Evolving Data Stream
1
作者 Amineh Amini Teh Ying Wah 《Journal of Computer and Communications》 2013年第5期26-31,共6页
Clustering evolving data streams is important to be performed in a limited time with a reasonable quality. The existing micro clustering based methods do not consider the distribution of data points inside the micro c... Clustering evolving data streams is important to be performed in a limited time with a reasonable quality. The existing micro clustering based methods do not consider the distribution of data points inside the micro cluster. We propose LeaDen-Stream (Leader Density-based clustering algorithm over evolving data Stream), a density-based clustering algorithm using leader clustering. The algorithm is based on a two-phase clustering. The online phase selects the proper mini-micro or micro-cluster leaders based on the distribution of data points in the micro clusters. Then, the leader centers are sent to the offline phase to form final clusters. In LeaDen-Stream, by carefully choosing between two kinds of micro leaders, we decrease time complexity of the clustering while maintaining the cluster quality. A pruning strategy is also used to filter out real data from noise by introducing dense and sparse mini-micro and micro-cluster leaders. Our performance study over a number of real and synthetic data sets demonstrates the effectiveness and efficiency of our method. 展开更多
关键词 EVOLVING data STREAMS Density-based clustering Micro cluster Mini-Micro cluster
暂未订购
Adaptive Spectral Clustering Ensemble Selection via Resampling and Population-Based Incremental Learning Algorithm 被引量:5
2
作者 XU Yuanchun JIA Jianhua 《Wuhan University Journal of Natural Sciences》 CAS 2011年第3期228-236,共9页
In this paper, we explore a novel ensemble method for spectral clustering. In contrast to the traditional clustering ensemble methods that combine all the obtained clustering results, we propose the adaptive spectral ... In this paper, we explore a novel ensemble method for spectral clustering. In contrast to the traditional clustering ensemble methods that combine all the obtained clustering results, we propose the adaptive spectral clustering ensemble method to achieve a better clustering solution. This method can adaptively assess the number of the component members, which is not owned by many other algorithms. The component clusterings of the ensemble system are generated by spectral clustering (SC) which bears some good characteristics to engender the diverse committees. The selection process works by evaluating the generated component spectral clustering through resampling technique and population-based incremental learning algorithm (PBIL). Experimental results on UCI datasets demonstrate that the proposed algorithm can achieve better results compared with traditional clustering ensemble methods, especially when the number of component clusterings is large. 展开更多
关键词 spectral clustering clustering ensemble selective ensemble RESAMPLING population-based incremental learning algorithm (PBIL) data clustering
原文传递
Outlier detection based on multi-dimensional clustering and local density
3
作者 SHOU Zhao-yu LI Meng-ya LI Si-min 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1299-1306,共8页
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl... Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments. 展开更多
关键词 data MINING OUTLIER DETECTION OUTLIER DETECTION method based on MULTI-DIMENSIONAL clusterING and local density (ODBMCLD) algorithm deviation DEGREE
在线阅读 下载PDF
基于Cluster的数据网格请求代理服务器设计 被引量:1
4
作者 黄斌 李春江 +2 位作者 肖侬 刘波 付伟 《计算机应用研究》 CSCD 北大核心 2004年第9期185-187,共3页
数据网格为数据密集型的应用提供了强有力的支持,数据服务是数据网格的核心,因而数据请求代理(DRB)服务器的设计是实现数据服务的关键。一个结构、性能较好的服务器能屏蔽数据的广域分布性和异构性,实现一体化数据访问、存储、传输与管... 数据网格为数据密集型的应用提供了强有力的支持,数据服务是数据网格的核心,因而数据请求代理(DRB)服务器的设计是实现数据服务的关键。一个结构、性能较好的服务器能屏蔽数据的广域分布性和异构性,实现一体化数据访问、存储、传输与管理。基于Cluster实现了一种数据请求代理服务器,这种服务器实现了上述目标,并具有许多优点,特别在具有多Cluster的高性能计算中,可以同时建立多个连接进行数据分块传输,能够获得Cluster-to-Cluster的聚集吞吐率。介绍了基于Cluster的DRB详细设计方案,描述了多个自治域的DRB之间协同服务的过程,并分析了这种设计的优点。 展开更多
关键词 cluster-based 数据网格 数据请求代理服务器 设计
在线阅读 下载PDF
Over-sampling algorithm for imbalanced data classification 被引量:13
5
作者 XU Xiaolong CHEN Wen SUN Yanfei 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第6期1182-1191,共10页
For imbalanced datasets, the focus of classification is to identify samples of the minority class. The performance of current data mining algorithms is not good enough for processing imbalanced datasets. The synthetic... For imbalanced datasets, the focus of classification is to identify samples of the minority class. The performance of current data mining algorithms is not good enough for processing imbalanced datasets. The synthetic minority over-sampling technique(SMOTE) is specifically designed for learning from imbalanced datasets, generating synthetic minority class examples by interpolating between minority class examples nearby. However, the SMOTE encounters the overgeneralization problem. The densitybased spatial clustering of applications with noise(DBSCAN) is not rigorous when dealing with the samples near the borderline.We optimize the DBSCAN algorithm for this problem to make clustering more reasonable. This paper integrates the optimized DBSCAN and SMOTE, and proposes a density-based synthetic minority over-sampling technique(DSMOTE). First, the optimized DBSCAN is used to divide the samples of the minority class into three groups, including core samples, borderline samples and noise samples, and then the noise samples of minority class is removed to synthesize more effective samples. In order to make full use of the information of core samples and borderline samples,different strategies are used to over-sample core samples and borderline samples. Experiments show that DSMOTE can achieve better results compared with SMOTE and Borderline-SMOTE in terms of precision, recall and F-value. 展开更多
关键词 imbalanced data density-based spatial clustering of applications with noise(DBSCAN) synthetic minority over sampling technique(SMOTE) over-sampling.
在线阅读 下载PDF
REMUDA: A Practical Topology Control and Data Forwarding Mechanism for Wireless Sensor Networks
6
作者 SUN Li-Min YAN Ting-Xin BI Yan-Zhong 《自动化学报》 EI CSCD 北大核心 2006年第6期867-874,共8页
In wireless sensor networks, topology control plays an important role for data forwarding efficiency in the data gathering applications. In this paper, we present a novel topology control and data forwarding mechanism... In wireless sensor networks, topology control plays an important role for data forwarding efficiency in the data gathering applications. In this paper, we present a novel topology control and data forwarding mechanism called REMUDA, which is designed for a practical indoor parking lot management system. REMUDA forms a tree-based hierarchical network topology which brings as many nodes as possible to be leaf nodes and constructs a virtual cluster structure. Meanwhile, it takes the reliability, stability and path length into account in the tree construction process. Through an experiment in a network of 30 real sensor nodes, we evaluate the performance of REMUDA and compare it with LEPS which is also a practical routing protocol in TinyOS. Experiment results show that REMUDA can achieve better performance than LEPS. 展开更多
关键词 data forwarding mechanism tree-based hierarchical topology virtual cluster
在线阅读 下载PDF
A New Integrated Fuzzifier Evaluation and Selection (NIFEs) Algorithm for Fuzzy Clustering
7
作者 Chanpaul Jin Wang Hua Fang +2 位作者 Sun Kim Ann Moormann Honggang Wang 《Journal of Applied Mathematics and Physics》 2015年第7期802-807,共6页
Fuzzy C-means (FCM) is simple and widely used for complex data pattern recognition and image analyses. However, selecting an appropriate fuzzifier (m) is crucial in identifying an optimal number of patterns and achiev... Fuzzy C-means (FCM) is simple and widely used for complex data pattern recognition and image analyses. However, selecting an appropriate fuzzifier (m) is crucial in identifying an optimal number of patterns and achieving higher clustering accuracy, which few studies have investigated. Built upon two existing methods on selecting fuzzifier, we developed an integrated fuzzifier evaluation and selection algorithm and tested it using real datasets. Our findings indicate that the consistent optimal number of clusters can be learnt from testing different fuzzifiers for each dataset and the fuzzifier with the lowest value for this consistency should be selected for clustering. Our evaluation also shows that the fuzzifier impacts the clustering accuracy. For longitudinal data with missing values, m = 2 could be an empirical rule to start fuzzy clustering, and the best clustering accuracy was achieved for tested data, especially using our multiple-imputation based fuzzy clustering. 展开更多
关键词 Fuzzifier FUZZY C-MEANS Multiple Imputation-based FUZZY clusterING (MIFuzzy) MISSING data Longitudinal data
暂未订购
Knowledge Based Consolidation of UML Diagrams for Creation of Virtual Enterprise
8
作者 Debasis Chanda Dwijesh Dutta Majumder Swapan Bhattacharya 《Intelligent Information Management》 2010年第3期159-177,共19页
In this paper we address the problem related to determination of the most suitable candidates for an M&amp;A (Merger &amp;Acquisition) scenario of Banks/Financial Institutions. During the pre-merger period of ... In this paper we address the problem related to determination of the most suitable candidates for an M&amp;A (Merger &amp;Acquisition) scenario of Banks/Financial Institutions. During the pre-merger period of an M&amp;A, a number of candidates may be available to undergo the Merger/Acquisition, but all of them may not be suitable. The normal practice is to carry out a due diligence exercise to identify the candidates that should lead to optimum increase in shareholder value and customer satisfaction, post-merger. The due diligence ought to be able to determine those candidates that are unsuitable for merger, those candidates that are relatively suitable, and those that are most suitable. Towards achieving the above objective, we propose a Fuzzy Data Mining Framework wherein Fuzzy Cluster Analysis concept is used for advisability of merger of two banks and other Financial Institutions. Subsequently, we propose orchestration/composition of business processes of two banks into consolidated business process during Merger &amp;Acquisition (M&amp;A) scenario. Our paper discusses modeling of individual business process with UML, and the consolidation of the individual business process models by means of our proposed Knowledge Based approach. 展开更多
关键词 Knowledge base PREDICATE CALCULUS Service Oriented Architecture UML Fuzzy data Mining cluster Analysis
暂未订购
基于密度的多度量空间数据聚类算法 被引量:2
9
作者 朱轶凡 罗程阳 +3 位作者 马瑞遥 陈璐 毛玉仁 高云君 《软件学报》 北大核心 2025年第2期851-873,共23页
具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难... 具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难以应对多模态(类型)数据并存的应用场景.随着信息技术的快速发展,数据呈现多模态化的发展态势,现实生活中的数据不再是单一的数据类型,而是多种数据模态(类型)的组合,如文本、图像、地理坐标、数据特征等.因此,现有的数据聚类方法难以对复杂的多模态数据进行有效的数据建模,更无法进行高效的多模态数据聚类.基于此,提出一种基于密度的多度量空间聚类算法.首先,为了刻画多模态数据间的复杂关系,利用多度量空间表征数据之间的相似性关系,并且利用聚合多度量图索引(AMG)实现多模态数据建模.接着,利用差分化的相似性关系优化聚合多度量图的图结构,并且结合最优策略优先的搜索策略进行剪枝,以实现高效的多模态数据聚类.最后,在真实与合成数据集上针对多种参数设置进行实验.实验结果验证了所提方法运行效率提升了至少1个数量级,并具有较高的聚类精度与良好的可扩展性. 展开更多
关键词 多度量空间 多度量图 基于密度的数据聚类 数据挖掘 多模态数据
在线阅读 下载PDF
On Density-Based Data Streams Clustering Algorithms: A Survey 被引量:10
10
作者 Amineh Amini Teh Ying Wah Hadi Saboohi 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第1期116-141,共26页
Clustering data streams has drawn lots of attention in the last few years due to their ever-growing presence. Data streams put additional challenges on clustering such as limited time and memory and one pass clusterin... Clustering data streams has drawn lots of attention in the last few years due to their ever-growing presence. Data streams put additional challenges on clustering such as limited time and memory and one pass clustering. Furthermore, discovering clusters with arbitrary shapes is very important in data stream applications. Data streams are infinite and evolving over time, and we do not have any knowledge about the number of clusters. In a data stream environment due to various factors, some noise appears occasionally. Density-based method is a remarkable class in clustering data streams, which has the ability to discover arbitrary shape clusters and to detect noise. Furthermore, it does not need the nmnber of clusters in advance. Due to data stream characteristics, the traditional density-based clustering is not applicable. Recently, a lot of density-based clustering algorithms are extended for data streams. The main idea in these algorithms is using density- based methods in the clustering process and at the same time overcoming the constraints, which are put out by data streanFs nature. The purpose of this paper is to shed light on some algorithms in the literature on density-based clustering over data streams. We not only summarize the main density-based clustering algorithms on data streams, discuss their uniqueness and limitations, but also explain how they address the challenges in clustering data streams. Moreover, we investigate the evaluation metrics used in validating cluster quality and measuring algorithms' performance. It is hoped that this survey will serve as a steppingstone for researchers studying data streams clustering, particularly density-based algorithms. 展开更多
关键词 data stream density-based clustering grid-based clustering micro-clustering
原文传递
基于SAE-MSCNN的网络入侵检测
11
作者 王泽辉 郝秦霞 《计算机工程与设计》 北大核心 2025年第10期2858-2865,共8页
针对现有的网络入侵检测方法忽略了流量特征间的关联性对特征选择的重要性,且在数据平衡时未能考虑到低频攻击样本的分布离散性,导致检测性能下降的问题,提出互信息值融合(mutual information value fusion,MIVF)方法来选择与攻击行为... 针对现有的网络入侵检测方法忽略了流量特征间的关联性对特征选择的重要性,且在数据平衡时未能考虑到低频攻击样本的分布离散性,导致检测性能下降的问题,提出互信息值融合(mutual information value fusion,MIVF)方法来选择与攻击行为相关性高且彼此之间关联性低的特征。提出基于DBSCAN改进的SMOTE方法对低频攻击样本按照其密度聚类分布进行过采样;构建SAE-MSCNN分类模型来检验性能。在NSL-KDD和UNSW-NB15数据集上验证,准确率分别达到92.89%和94.85%。结果表明所提方法可以有效地选择特征以及平衡数据,尤其是提高低频攻击的检测准确率。 展开更多
关键词 网络入侵检测 互信息 特征关联 特征选择 密度聚类 过采样 数据平衡
在线阅读 下载PDF
基于集成学习的物联网通信数据快速分类研究
12
作者 杨瑞丽 王俊仃 邱秀荣 《通信电源技术》 2025年第5期4-6,共3页
物联网设备持续产出的数据中会掺杂部分异常数据,导致物联网通信数据分类的质量与效率下降。因此,提出一种基于集成学习的物联网通信数据快速分类方法。从物联网设备收集通信数据,利用孤立森林算法确定物联网通信数据样本的异常分值,并... 物联网设备持续产出的数据中会掺杂部分异常数据,导致物联网通信数据分类的质量与效率下降。因此,提出一种基于集成学习的物联网通信数据快速分类方法。从物联网设备收集通信数据,利用孤立森林算法确定物联网通信数据样本的异常分值,并去除异常分值较高的数据,通过基于密度的带噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法整合去除异常后的数据,结合集成学习算法实现物联网通信数据快速分类。实验结果表明,所提方法的物联网通信数据分类准确率始终在97.2%以上,物联网通信数据分类时间均值约为1.55 s,具有良好的应用潜力。 展开更多
关键词 集成学习 物联网通信 数据分类 基于密度的带噪声应用空间聚类(DBSCAN)
在线阅读 下载PDF
基于DBSCAN和CGAN的不平衡数据过采样方法
13
作者 唐曦 李文海 +2 位作者 唐贞豪 李睿峰 李根 《系统工程与电子技术》 北大核心 2025年第11期3739-3753,共15页
为改善分类器对不平衡数据的分类精度,提出一种基于密度的带噪声的空间聚类方法(density-based spatial clustering of applications with noise, DBSCAN)和条件生成对抗网络(conditional generative adversarial network,CGAN)的过采... 为改善分类器对不平衡数据的分类精度,提出一种基于密度的带噪声的空间聚类方法(density-based spatial clustering of applications with noise, DBSCAN)和条件生成对抗网络(conditional generative adversarial network,CGAN)的过采样方法。首先,采用DBSCAN对正负类样本分别聚类,结合簇标签重构样本集,并结合安全级别识别和剔除噪声样本,提升数据质量。然后,将新的样本集输入CGAN模型进行训练,针对CGAN中训练不稳定和模式崩塌的问题,引入Wasserstein距离和梯度惩罚项作为损失函数,并结合分类问题对Wasserstein距离做了适应性改造,实现高质量少数类样本生成。最后,采用9个通用不平衡数据集和1个模拟电路实测数据集,在3种典型分类器上将所提方法与5个经典过采样方法进行对比实验。结果表明,所提方法在多数数据集上优于其他过采样算法,尤其在类别不平衡度较高时优势更为突出。所提方法为不平衡数据处理提供了新的思路。 展开更多
关键词 不平衡数据 条件生成对抗网络 基于密度的带噪声的空间聚类方法 过采样
在线阅读 下载PDF
基于规则库和聚类分析的复句短语字段的自动识别研究 被引量:9
14
作者 胡金柱 俞小娟 +1 位作者 李琼 周毕吉 《华中师范大学学报(自然科学版)》 CAS CSCD 2008年第2期190-194,共5页
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的... 复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%. 展开更多
关键词 短语字段 规则库 聚类分析 变量
在线阅读 下载PDF
一种基于密度的空间数据流在线聚类算法 被引量:28
15
作者 于彦伟 王沁 +1 位作者 邝俊 何杰 《自动化学报》 EI CSCD 北大核心 2012年第6期1051-1059,共9页
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点... 为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms. 展开更多
关键词 空间数据挖掘 聚类数据流 基于密度的聚类 在线算法 噪声处理
在线阅读 下载PDF
自注意力优化密度聚类的风机数据清洗方法
16
作者 张茹顶 张铖 +3 位作者 潘钱宇 李少帅 孟井煜枫 吴博阳 《微特电机》 2025年第4期34-38,共5页
针对风电机组监控与数据采集系统常受多种因素影响,导致数据异常问题,提出一种基于自注意力编码器改进的密度聚类模型方法,结合自注意力编码器的特征提取能力和密度聚类的空间特性,通过引入相对位置编码和优化多头注意力机制,提升对监... 针对风电机组监控与数据采集系统常受多种因素影响,导致数据异常问题,提出一种基于自注意力编码器改进的密度聚类模型方法,结合自注意力编码器的特征提取能力和密度聚类的空间特性,通过引入相对位置编码和优化多头注意力机制,提升对监控与数据采集系统异常数据识别能力。实验结果表明,所提方法的数据清洗效果和模型精度与传统方法相比更优,其中异常数据剔除率达到26.58%,并且在拟合风速-功率曲线时,平均绝对误差、均方根误差最低,决定系数最高。清洗后的监控与数据采集系统数据应用于机组故障诊断,将风电机组故障识别准确性提高到了92%以上、故障预警及时性提前了20%,故障类型分类精度提高了30%。该方法不仅提高了风电机组的运行效率和可靠性,还为风电场的运行管理和决策提供了较为可靠的数据支持。 展开更多
关键词 自注意力编码器 密度聚类算法 数据清洗 监控与数据采集系统 风电机组
在线阅读 下载PDF
基于MapReduce的分治k均值聚类方法 被引量:8
17
作者 臧艳辉 席运江 赵雪章 《计算机工程与设计》 北大核心 2020年第5期1345-1351,共7页
针对原始k均值法在MapReduce建模中执行时间较长和聚类结果欠佳问题,提出一种基于MapReduce的分治k均值聚类方法。采取分治法处理大数据集,将所要处理的整个数据集拆分为较小的块并存储在每台机器的主存储器中;通过可用的机器传播,将数... 针对原始k均值法在MapReduce建模中执行时间较长和聚类结果欠佳问题,提出一种基于MapReduce的分治k均值聚类方法。采取分治法处理大数据集,将所要处理的整个数据集拆分为较小的块并存储在每台机器的主存储器中;通过可用的机器传播,将数据集的每个块由其分配的机器独立地进行聚类;采用最小加权距离确定数据点应该被分配的类簇,判断收敛性。实验结果表明,与传统k均值聚类方法和流式k均值聚类方法相比,所提方法用时更短,结果更优。 展开更多
关键词 数据聚类 基于MapReduce的聚类 分治法 大数据 k均值法
在线阅读 下载PDF
基于密度的计算机兵棋推演数据快速聚类算法 被引量:5
18
作者 石崇林 张茂军 +2 位作者 吴琳 唐宇波 景民 《系统工程与电子技术》 EI CSCD 北大核心 2011年第11期2428-2433,共6页
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上... 针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。 展开更多
关键词 数据挖掘 兵棋推演数据 基于密度的聚类算法 最短可行路径
在线阅读 下载PDF
WSN中基于分簇路由的多维度数据压缩算法研究 被引量:7
19
作者 尹震宇 赵海 +1 位作者 徐久强 王金英 《电子学报》 EI CAS CSCD 北大核心 2009年第5期1109-1114,共6页
本文在不减少基站获取传感信息量的前提下,以最大程度减少传输数据量为目的,提出一种在分簇路由协议支持下的时间、空间多维度的数据压缩算法.结合基于空间维度的数据压缩方式设计了一种改进的分簇路由.通过实例验证与仿真评测,该数据... 本文在不减少基站获取传感信息量的前提下,以最大程度减少传输数据量为目的,提出一种在分簇路由协议支持下的时间、空间多维度的数据压缩算法.结合基于空间维度的数据压缩方式设计了一种改进的分簇路由.通过实例验证与仿真评测,该数据压缩算法以及配合该算法设计的路由协议可以显著的减少整个无线传感器网络中数据发送量,延长网络的生存周期. 展开更多
关键词 数据压缩 分簇路由 路由 无线传感器网络
在线阅读 下载PDF
基于密度-距离图的交互式体数据分类方法 被引量:6
20
作者 周芳芳 高飞 +2 位作者 刘勇刚 梁兴 赵颖 《软件学报》 EI CSCD 北大核心 2016年第5期1061-1073,共13页
体数据分类是体绘制中传递函数设计的核心问题.标量值-梯度模直方图作为表征体数据的一种经典二维特征空间,已被广泛应用于分类体数据.然而,大部分已有方法存在过于依赖分类算法的参数设置、运算效率低、交互复杂度高等问题.以标量值-... 体数据分类是体绘制中传递函数设计的核心问题.标量值-梯度模直方图作为表征体数据的一种经典二维特征空间,已被广泛应用于分类体数据.然而,大部分已有方法存在过于依赖分类算法的参数设置、运算效率低、交互复杂度高等问题.以标量值-梯度模直方图的密度分布为基础,并依据物质中心密度大且物质中心间距离远这一特性,首先快速计算每个数据点的密度及每个数据点到比其密度大的点的最小距离;然后,将所有数据点投影到密度-距离图,并以密度-距离图作为人机接口,使用户能够交互地选择多个密度中心来分类体数据并设置传递函数.通过多组实验验证,所提出的方法无需预设物质类别的数量,分割标量值-梯度模直方图的准确度较高且速度较快,所设计的密度-距离图是一个有效的人机交互接口,可以有效地引导用户完成由粗糙到精细的递进式体数据分类和可视化过程. 展开更多
关键词 体数据 传递函数 体数据分类 基于密度的聚类
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部