期刊文献+
共找到1,031篇文章
< 1 2 52 >
每页显示 20 50 100
Self-Cumulative Contrastive Graph Clustering
1
作者 Xiaoqiang Yan Kun Deng +2 位作者 Quan Zou Zhen Tian Hui Yu 《IEEE/CAA Journal of Automatica Sinica》 2025年第6期1194-1208,共15页
Contrastive graph clustering(CGC)has become a prominent method for self-supervised representation learning by contrasting augmented graph data pairs.However,the performance of CGC methods critically depends on the cho... Contrastive graph clustering(CGC)has become a prominent method for self-supervised representation learning by contrasting augmented graph data pairs.However,the performance of CGC methods critically depends on the choice of data augmentation,which usually limits the capacity of network generalization.Besides,most existing methods characterize positive and negative samples based on the nodes themselves,ignoring the influence of neighbors with different hop numbers on the node.In this study,a novel self-cumulative contrastive graph clustering(SC-CGC)method is devised,which is capable of dynamically adjusting the influence of neighbors with different hops.Our intuition is that better neighbors are closer and distant ones are further away in their feature space,thus we can perform neighbor contrasting without data augmentation.To be specific,SC-CGC relies on two neural networks,i.e.,autoencoder network(AE)and graph autoencoder network(GAE),to encode the node information and graph structure,respectively.To make these two networks interact and learn from each other,a dynamic fusion mechanism is devised to transfer the knowledge learned by AE to the corresponding GAE layer by layer.Then,a self-cumulative contrastive loss function is designed to characterize the structural information by dynamically accumulating the influence of the nodes with different hops.Finally,our approach simultaneously refines the representation learning and clustering assignments in a self-supervised manner.Extensive experiments on 8 realistic datasets demonstrate that SC-CGC consistently performs better over SOTA techniques.The code is available at https://github.com/Xiaoqiang-Yan/JAS-SCCGC. 展开更多
关键词 Dynamic fusion mechanism graph clustering selfcumulative contrastive learning self-supervised clustering
在线阅读 下载PDF
Neighbor Dual-Consistency Constrained Attribute-Graph Clustering
2
作者 Tian Tian Boyue Wang +2 位作者 Xiaxia He Wentong Wang Meng Wang 《Computers, Materials & Continua》 2025年第12期4885-4898,共14页
Attribute-graph clustering aims to divide the graph nodes into distinct clusters in an unsupervised manner,which usually encodes the node attribute feature and the corresponding graph structure into a latent feature s... Attribute-graph clustering aims to divide the graph nodes into distinct clusters in an unsupervised manner,which usually encodes the node attribute feature and the corresponding graph structure into a latent feature space.However,traditional attribute-graph clustering methods often neglect the effect of neighbor information on clustering,leading to suboptimal clustering results as they fail to fully leverage the rich contextual information provided by neighboring nodes,which is crucial for capturing the intrinsic relationships between nodes and improving clustering performance.In this paper,we propose a novel Neighbor Dual-Consistency Constrained Attribute-Graph Clustering that leverages information from neighboring nodes in two significant aspects:neighbor feature consistency and neighbor distribution consistency.To enhance feature consistency among nodes and their neighbors,we introduce a neighbor contrastive loss that encourages the embeddings of nodes to be closer to those of their similar neighbors in the feature space while pushing them further apart from dissimilar neighbors.This method helps the model better capture local feature information.Furthermore,to ensure consistent cluster assignments between nodes and their neighbors,we introduce a neighbor distribution consistency module,which combines structural information from the graph with similarity of attributes to align cluster assignments between nodes and their neighbors.By integrating both local structural information and global attribute information,our approach effectively captures comprehensive patterns within the graph.Overall,our method demonstrates superior performance in capturing comprehensive patterns within the graph and achieves state-of-the-art clustering results on multiple datasets. 展开更多
关键词 graph convolution clustering deep clustering contrastive learning
在线阅读 下载PDF
Identify Implicit Communities by Graph Clustering
3
作者 YANG Nan MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1109-1113,共5页
How to find these communities is an important research work. Recently, community discovery are mainly categorized to HITS algorithm, bipartite cores algorithm and maximum flow/minimum cut framework. In this paper, we ... How to find these communities is an important research work. Recently, community discovery are mainly categorized to HITS algorithm, bipartite cores algorithm and maximum flow/minimum cut framework. In this paper, we proposed a new method to extract communities. The MCL algorithm, which is short for the Markov Cluster Algorithm, a fast and scalable unsupervised cluster algorithm is used to extract communities. By putting mirror deleting procedure behind graph clustering, we decrease comparing cost considerably. After MCL and mirror deletion, we use community member select algorithm to produce the sets of community candidates. The experiment and results show the new method works effectively and properly. 展开更多
关键词 Web community link analysis graph clustering MCL
在线阅读 下载PDF
Index-adaptive Triangle-Based Graph Local Clustering
4
作者 Yuan Zhe Wei Zhewei Wen Ji-rong 《Computers, Materials & Continua》 SCIE EI 2023年第6期5009-5026,共18页
Motif-based graph local clustering(MGLC)algorithms are gen-erally designed with the two-phase framework,which gets the motif weight for each edge beforehand and then conducts the local clustering algorithm on the weig... Motif-based graph local clustering(MGLC)algorithms are gen-erally designed with the two-phase framework,which gets the motif weight for each edge beforehand and then conducts the local clustering algorithm on the weighted graph to output the result.Despite correctness,this frame-work brings limitations on both practical and theoretical aspects and is less applicable in real interactive situations.This research develops a purely local and index-adaptive method,Index-adaptive Triangle-based Graph Local Clustering(TGLC+),to solve the MGLC problem w.r.t.triangle.TGLC+combines the approximated Monte-Carlo method Triangle-based Random Walk(TRW)and deterministic Brute-Force method Triangle-based Forward Push(TFP)adaptively to estimate the Personalized PageRank(PPR)vector without calculating the exact triangle-weighted transition probability and then outputs the clustering result by conducting the standard sweep procedure.This paper presents the efficiency of TGLC+through theoretical analysis and demonstrates its effectiveness through extensive experiments.To our knowl-edge,TGLC+is the first to solve the MGLC problem without computing the motif weight beforehand,thus achieving better efficiency with comparable effectiveness.TGLC+is suitable for large-scale and interactive graph analysis tasks,including visualization,system optimization,and decision-making. 展开更多
关键词 graph local clustering triangle motif sampling method
在线阅读 下载PDF
Identifying Composite Crosscutting Concerns with Scatter-Based Graph Clustering
5
作者 HUANG Jin BETEV Latchezar +2 位作者 CARMINATI Federico ZHU Jianlin LU Yansheng 《Wuhan University Journal of Natural Sciences》 CAS 2012年第2期114-120,共7页
Identifying composite crosscutting concerns(CCs) is a research task and challenge of aspect mining.In this paper,we propose a scatter-based graph clustering approach to identify composite CCs.Inspired by the state-o... Identifying composite crosscutting concerns(CCs) is a research task and challenge of aspect mining.In this paper,we propose a scatter-based graph clustering approach to identify composite CCs.Inspired by the state-of-the-art link analysis tech-niques,we propose a two-state model to approximate how CCs tangle with core modules.According to this model,we obtain scatter and centralization scores for each program element.Espe-cially,the scatter scores are adopted to select CC seeds.Further-more,to identify composite CCs,we adopt a novel similarity measurement and develop an undirected graph clustering to group these seeds.Finally,we compare it with the previous work and illustrate its effectiveness in identifying composite CCs. 展开更多
关键词 software engineering aspect mining link analysis undirected graph clustering
原文传递
The Refinement Algorithm Consideration in Text Clustering Scheme Based on Multilevel Graph
6
作者 CHENJian-bin DONGXiang-jun SONGHan-tao 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期671-675,共5页
To construct a high efficient text clustering algorithm the multilevel graph model and the refinement algorithm used in the uncoarsening phase is discussed. The model is applied to text clustering. The performance of ... To construct a high efficient text clustering algorithm the multilevel graph model and the refinement algorithm used in the uncoarsening phase is discussed. The model is applied to text clustering. The performance of clustering algorithm has to be improved with the refinement algorithm application. The experiment result demonstrated that the multilevel graph text clustering algorithm is available. Key words text clustering - multilevel coarsen graph model - refinement algorithm - high-dimensional clustering CLC number TP301 Foundation item: Supported by the National Natural Science Foundation of China (60173051)Biography: CHEN Jian-bin(1970-), male, Associate professor, Ph. D., research direction: data mining. 展开更多
关键词 text clustering multilevel coarsen graph model refinement algorithm high-dimensional clustering
在线阅读 下载PDF
K-Means Graph Database Clustering and Matching for Fingerprint Recognition
7
作者 Vaishali Pawar Mukesh Zaveri 《Intelligent Information Management》 2015年第4期242-251,共10页
The graph can contain huge amount of data. It is heavily used for pattern recognition and matching tasks like symbol recognition, information retrieval, data mining etc. In all these applications, the objects or under... The graph can contain huge amount of data. It is heavily used for pattern recognition and matching tasks like symbol recognition, information retrieval, data mining etc. In all these applications, the objects or underlying data are represented in the form of graph and graph based matching is performed. The conventional algorithms of graph matching have higher complexity. This is because the most of the applications have large number of sub graphs and the matching of these sub graphs becomes computationally expensive. In this paper, we propose a graph based novel algorithm for fingerprint recognition. In our work we perform graph based clustering which reduces the computational complexity heavily. In our algorithm, we exploit structural features of the fingerprint for K-means clustering of the database. The proposed algorithm is evaluated using realtime fingerprint database and the simulation results show that our algorithm outperforms the existing algorithm for the same task. 展开更多
关键词 PATTERN Recognition FINGERPRINT MATCHING graph MATCHING clusterING
在线阅读 下载PDF
基于图注意力自编码器的自适应加权深度图聚类算法
8
作者 徐森 王作为 +4 位作者 郭乃瑄 卞学胜 徐秀芳 花小朋 周天 《控制与决策》 北大核心 2026年第1期213-220,共8页
现有深度图聚类方法因依赖静态初始图结构而存在显著局限性,此类结构通常不完整或存在偏差,且难以动态捕捉节点相似性变化.对此,提出基于图注意力自编码器的自适应加权深度图聚类算法(AWDGC).首先,通过可训练的广义马氏距离结合高斯核函... 现有深度图聚类方法因依赖静态初始图结构而存在显著局限性,此类结构通常不完整或存在偏差,且难以动态捕捉节点相似性变化.对此,提出基于图注意力自编码器的自适应加权深度图聚类算法(AWDGC).首先,通过可训练的广义马氏距离结合高斯核函数,自适应分配边权重以构建加权邻接矩阵;其次,设计图注意力自编码器,通过注意力机制融合多阶邻居信息以增强特征判别性;然后,提出基于节点相似性的动态结构优化策略,周期性更新邻接矩阵以捕捉相似性动态变化;最后,引入自监督聚类模块,通过KL散度优化聚类分布对齐,提升特征表示与聚类任务的协同性.在ACM、DBLP、CITESEER、TEXAS等6个公开数据集上的实验表明,AWDGC在聚类指标上均显著优于8个代表性基线方法. 展开更多
关键词 深度图聚类 自适应加权 图注意力网络 图自编码器 动态结构优化 自监督学习
原文传递
对比学习引导的双通道自适应融合网络多视图聚类方法
9
作者 周丽娟 刘子源 +1 位作者 许鑫航 张志鸿 《小型微型计算机系统》 北大核心 2026年第1期229-239,共11页
近年来,图卷积网络在多视图聚类中表现突出,但其侧重节点间结构信息建模,而属性信息仅通过简单的线性变换进行更新,限制了模型对节点属性信息的学习能力.为此,本文提出了对比学习引导的双通道自适应融合网络多视图聚类方法.首先,结合自... 近年来,图卷积网络在多视图聚类中表现突出,但其侧重节点间结构信息建模,而属性信息仅通过简单的线性变换进行更新,限制了模型对节点属性信息的学习能力.为此,本文提出了对比学习引导的双通道自适应融合网络多视图聚类方法.首先,结合自编码器与图自编码器构建双通道网络,分别编码节点属性和结构信息,并设计通道自适应融合模块,利用注意力机制自适应融合不同通道网络在同一神经网络层中学习的属性与结构信息,以及不同神经网络层间的嵌入表示,以获得每个视图的嵌入表示.在此基础上,进一步利用注意力机制对多个视图的嵌入表示进行加权融合获得全局嵌入表示.最后,通过跨视图对比损失与自监督聚类损失迭代优化全局嵌入表示,强化视图间一致性信息学习,并生成了面向聚类任务的高质量嵌入表示.在3个公开数据集和3个来自郑州商品交易所的期货数据集上进行的实验表明,该方法在聚类任务中表现优异. 展开更多
关键词 多视图聚类 自编码器 图自编码器 双通道网络
在线阅读 下载PDF
融合图神经网络和深度图聚类的联邦推荐算法
10
作者 伊华伟 宋仕玺 +1 位作者 王艳飞 白思怡 《应用科学学报》 北大核心 2026年第1期83-96,共14页
联邦学习作为解决推荐系统隐私安全问题的主流框架,在实际应用中却面临推荐精度欠佳、隐私保护力度不足及通信开销过大的问题。针对这些问题,本文提出一种融合图神经网络与深度图聚类的联邦推荐算法。首先,利用图神经网络对复杂的用户-... 联邦学习作为解决推荐系统隐私安全问题的主流框架,在实际应用中却面临推荐精度欠佳、隐私保护力度不足及通信开销过大的问题。针对这些问题,本文提出一种融合图神经网络与深度图聚类的联邦推荐算法。首先,利用图神经网络对复杂的用户-项目的高阶交互关系进行捕捉,以提升推荐系统的推荐精度;其次,在联邦学习客户端与服务器端的通信环节注入差分隐私噪声以模糊真实梯度,进而增强推荐系统的隐私保护能力;最后,通过引入深度图聚类对客户端实施聚类,选取各簇的客户端代表参与训练,并将所得参数在簇内共享,以加快模型收敛速度,降低联邦学习框架下的通信开销。基于真实数据集的实验结果表明,所提算法在提高推荐精度的同时,能够增强系统的隐私保护力度并减少通信开销。 展开更多
关键词 推荐系统 联邦学习 隐私保护 深度图聚类 图神经网络
在线阅读 下载PDF
基于样本互补锚点图的缺失多视图聚类算法
11
作者 刘小兰 徐宇鸿 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期16-24,共9页
随着多视图数据在现实场景中得到广泛应用,如何处理缺失视图下的聚类问题已成为机器学习领域的重要挑战。传统锚点图聚类算法依赖完整实例构建锚点图,这导致其在高缺失率下因锚点不足难以表征数据结构,在低缺失率时又无法发挥锚点的优... 随着多视图数据在现实场景中得到广泛应用,如何处理缺失视图下的聚类问题已成为机器学习领域的重要挑战。传统锚点图聚类算法依赖完整实例构建锚点图,这导致其在高缺失率下因锚点不足难以表征数据结构,在低缺失率时又无法发挥锚点的优势。针对传统锚点图聚类算法中存在的锚点选择受限、权重分配僵化和计算复杂度高的问题,该文提出了一种基于样本互补锚点图的缺失多视图聚类算法(IMVC-SAC)。该算法首先设计跨视图锚点互补机制,通过在共有样本与视图特有样本中自适应选取锚点,以解决高缺失率下数据结构表征不足的问题;然后建立缺失模式感知的权重模型,依据样本的缺失模式与程度调整视图对相似矩阵的贡献度;最后利用双随机非负矩阵可分解特性,将谱聚类的时间复杂度从样本规模的立方阶复杂度优化至线性阶复杂度。在5个公开数据集上的实验结果表明,该算法的聚类性能优于目前主流算法,尤其在高缺失率下仍能保持较好的聚类效果,验证了其鲁棒性与有效性。 展开更多
关键词 缺失多视图聚类 锚点图 样本互补 相似矩阵融合 谱聚类
在线阅读 下载PDF
MalCommunity: A Graph-Based Evaluation Model for Malware Family Clustering
12
作者 Yihang Chen Fudong Liu +1 位作者 Zheng Shan Guanghui Liang 《国际计算机前沿大会会议论文集》 2018年第1期21-21,共1页
在线阅读 下载PDF
知识图谱领域核心文献的识别与内容分析
13
作者 魏瑞斌 徐艳 王伊丹 《大学图书情报学刊》 2026年第2期80-90,共11页
知识图谱是一个跨学科研究主题,对推动语义理解、智能推理与大模型发展具有关键作用。文章从Web of Science核心合集中检索获取2010—2024年间1703篇知识图谱领域的研究论文,并通过h指数确定了78篇高被引文献。然后,使用VOSviewer构建... 知识图谱是一个跨学科研究主题,对推动语义理解、智能推理与大模型发展具有关键作用。文章从Web of Science核心合集中检索获取2010—2024年间1703篇知识图谱领域的研究论文,并通过h指数确定了78篇高被引文献。然后,使用VOSviewer构建共被引网络并进行聚类分析,最终结合内容分析方法对识别出的50篇核心文献进行主题归纳与深入解读。研究发现,文献共被引方法能有效识别领域内的核心文献集群。研究选择的知识图谱领域的50篇核心文献,可归纳为四个主要研究方向:知识图谱理论基础与构建方法、知识图谱嵌入、基于知识图谱的知识推理以及基于知识图谱的推荐系统。 展开更多
关键词 文献共被引 核心文献 知识图谱 聚类分析 VOSviewer
在线阅读 下载PDF
基于时空特征原型的视频场景图生成
14
作者 王庆 严沁 +2 位作者 孙永宣 李圣豪 许闻 《微电子学与计算机》 2026年第2期95-103,共9页
视频场景图生成是将视频中的对象作为节点,对象之间的关系作为边的一种结构化描述,有利于对图片的深层理解。现有方法无法区分相似的空间位置关系、无法区分由于时间变化导致的接触关系变化。为了解决上述问题,提出了一种基于时空特征... 视频场景图生成是将视频中的对象作为节点,对象之间的关系作为边的一种结构化描述,有利于对图片的深层理解。现有方法无法区分相似的空间位置关系、无法区分由于时间变化导致的接触关系变化。为了解决上述问题,提出了一种基于时空特征原型的视频场景图生成模型。在该模型中,通过对时空Transformer提取出的时空特征进行聚类原型学习,得到关系的空间特征原型和时间特征原型。利用关系的空间特征原型与当前特征进行相似度计算,并与余弦距离最小的空间特征原型进行融合,空间特征原型对关系特征进行全局建模,能够有效区分相似的空间位置关系。同时,时间特征原型是基于全局时间特征对关系上下文特征进行建模。因此,利用时间特征原型与当前特征进行融合,有效地结合了局部时间信息和全局时间信息,能够有效地区分动态关系变化。上述的空间特征原型生成器、时间特征原型生成器,描述的是交互关系在空间、时间上对应的特征原型,二者在关系的空间特征学习、时间特征学习上具有较强的互补作用。实验在Action Genome数据集上进行验证,实验数据表明:基于时空特征原型的视频场景图生成模型,优于现有的视频场景图生成方法。 展开更多
关键词 视频场景图 原型 聚类 相似度
在线阅读 下载PDF
基于CiteSpace的降雨灾害领域研究文献量化分析
15
作者 闫雪辉 张念 +2 位作者 万飞 郭冰冰 吴孟佳 《自然灾害学报》 北大核心 2026年第1期11-21,共11页
为明确降雨灾害领域的研究方向与内容,统计研究热点现状,分析未来发展前景与趋势。该文基于知识图谱可视化软件CiteSpace,对中国知网(CNKI)数据库中检索的2445篇降雨灾害领域相关文献进行整体性量化分析。通过对文献关键词和作者发文机... 为明确降雨灾害领域的研究方向与内容,统计研究热点现状,分析未来发展前景与趋势。该文基于知识图谱可视化软件CiteSpace,对中国知网(CNKI)数据库中检索的2445篇降雨灾害领域相关文献进行整体性量化分析。通过对文献关键词和作者发文机构的分析,得到了关键词年轮图谱与热点分割、关键词聚类图谱、时间线聚类图谱和作者机构聚类分析。结果表明,滑坡、泥石流、地质灾害、降雨和暴雨的研究是降雨灾害领域研究主流方向,具有突发性、热点性与时效性的特殊事件的相关研究会促进该领域研究的发展与进步。降雨灾害领域研究的重心从成因与治理转变为监测预警与风险评估,多学科领域交叉融合是未来该领域研究的趋势与挑战。数值模拟、机器学习、大数据与神经网络是未来主要研究方法。由此可见,着眼全球气候变化局面,聚焦降雨灾害频发态势,多元化的新理论、新技术、新方法与各学科领域相结合起来,将是未来降雨灾害领域研究的趋势与挑战。 展开更多
关键词 CITESPACE 降雨灾害领域研究 量化分析 知识图谱 年轮图谱 聚类图谱
原文传递
一种面向高动态网络的因果增强时空图预测模型
16
作者 张家畅 霍永华 张立斌 《计算机测量与控制》 2026年第2期104-110,共7页
针对高动态环境下网络链路质量预测的问题,提出了一种状态聚类引导的因果时空图卷积网络架构Causal-Clustered STGCN;突破了基于形状相似性的时序状态划分、状态特异的因果图构建,以及因果约束下的时空特征聚合等关键技术,实现了对网络... 针对高动态环境下网络链路质量预测的问题,提出了一种状态聚类引导的因果时空图卷积网络架构Causal-Clustered STGCN;突破了基于形状相似性的时序状态划分、状态特异的因果图构建,以及因果约束下的时空特征聚合等关键技术,实现了对网络运行模式的自适应感知与跨物理连接的隐性依赖捕捉;核心思想是通过K-shape聚类将连续状态划分为典型模式,并在各状态内部基于因果检验构建有向加权因果图,以取代传统物理拓扑作为图卷积的空间先验,使特征聚合严格遵循因果路径;实验基于SynthSoM数据集,在标准场景下预测精度较最优基线提升6.7%,并在复杂场景中保持优势。 展开更多
关键词 图神经网络 因果图 链路质量 K-shape聚类 高动态网络
在线阅读 下载PDF
基于多尺度的改进Graph cut算法 被引量:3
17
作者 樊淑炎 丁世飞 《山东大学学报(工学版)》 CAS 北大核心 2016年第1期28-33,共6页
针对Graph cut算法存在着计算复杂度高及可能出现过分割等不足,提出了一种基于多尺度的改进算法,以更好地解决图像分割问题。该算法将多尺度的Normalized cut作为Graph cut算法的目标函数,避免了过分割的现象,同时将精细尺度的精确性和... 针对Graph cut算法存在着计算复杂度高及可能出现过分割等不足,提出了一种基于多尺度的改进算法,以更好地解决图像分割问题。该算法将多尺度的Normalized cut作为Graph cut算法的目标函数,避免了过分割的现象,同时将精细尺度的精确性和粗糙尺度的易分割性统一结合起来,对像素点进行采样,不仅保留了原来像素点间的关系,还降低了计算复杂度。然后运用基于谱图理论的求解方式,将问题转化为对相似矩阵求解特征值和特征向量的问题,相似度较高。试验结果表明,本研究算法能够对用户选取的图片进行有效地分割,无需用户交互,分割快速且结果精确。 展开更多
关键词 graph CUT 多尺度 Normalized CUT 谱聚类 图像分割 图论
原文传递
基于Graph模型的海量用电数据并行聚类分析 被引量:21
18
作者 陶鹏 张洋瑞 +1 位作者 李梦宇 李杰琳 《电力科学与技术学报》 CAS 北大核心 2020年第6期144-151,共8页
随着智能电网建设的不断深入,在配用电环节收集的监测数据越来越多,逐渐构成智能电网用户侧大数据。传统数据分析模式已经无法满足性能需求,迫切需要新的存储和数据分析模式来应对。提出基于阿里云大数据分析平台MaxCompute的海量用电... 随着智能电网建设的不断深入,在配用电环节收集的监测数据越来越多,逐渐构成智能电网用户侧大数据。传统数据分析模式已经无法满足性能需求,迫切需要新的存储和数据分析模式来应对。提出基于阿里云大数据分析平台MaxCompute的海量用电数据聚类分析方法,该方法充分考虑用电数据的特点,设计基于多级分区表的用电数据存储模式,采用三相电压、三相电流、三相功率因数等建立多维数据特征,应用MaxCompute Graph框架设计实现高效的海量用电数据的聚类划分算法。实验结果表明,所设计的存储模式可有效提升用电数据的检索效率;通过对不同用电类型的用户进行聚类划分,聚类准确率达到88%,验证了聚类划分的有效性和高性能。 展开更多
关键词 用电数据分析 大数据 聚类 graph 云计算
在线阅读 下载PDF
基于GraphX的分布式幂迭代聚类 被引量:3
19
作者 赵军 徐晓燕 《计算机应用》 CSCD 北大核心 2016年第10期2710-2714,共5页
为解决幂迭代聚类算法并行实现中存在的编程繁琐、效率低下等问题,基于Spark大规模数据通用计算引擎及其Graph X组件,提出了一种在分布式环境下实现幂迭代聚类的方法。首先,利用某种相似性度量方法,将原始数据转换成一个可以视为图的亲... 为解决幂迭代聚类算法并行实现中存在的编程繁琐、效率低下等问题,基于Spark大规模数据通用计算引擎及其Graph X组件,提出了一种在分布式环境下实现幂迭代聚类的方法。首先,利用某种相似性度量方法,将原始数据转换成一个可以视为图的亲和矩阵;然后,通过顶点切割,把行归一化后的亲和矩阵切分成若干个小图,分别存储在不同的机器上;最后,利用Spark基于内存计算的特点,对存储在集群中的图进行多次迭代计算,得到这个图的一个切割,图的每一个划分子图对应一个类簇。在不同规模的数据集和不同executor个数下进行的实验结果表明,基于Graph X的分布式幂迭代聚类算法具有良好的可扩展性,算法运行时间与executor个数呈负相关的线性关系,在6个executor下,与单个executor相比,算法的加速比达到了2.09到3.77。同时,通过与基于Hadoop的幂迭代聚类进行对比,在新闻数量为40 000篇时,运行时间降低了61%。 展开更多
关键词 graphX 图计算 幂迭代聚类 内存计算 RDD
在线阅读 下载PDF
结合形状约束的Graph Cut行人分割 被引量:1
20
作者 胡江华 王文中 +1 位作者 罗斌 汤进 《计算机应用》 CSCD 北大核心 2014年第3期837-840,共4页
传统的Graph Cut算法没有对目标的形状予以限制,很难得到语义化的分割结果,即无法保证分割出来的是"行人"。针对该问题提出一种结合形状和底层特征的Graph Cut算法。对于行人分割,用大量真实行人轮廓来表达"行人"... 传统的Graph Cut算法没有对目标的形状予以限制,很难得到语义化的分割结果,即无法保证分割出来的是"行人"。针对该问题提出一种结合形状和底层特征的Graph Cut算法。对于行人分割,用大量真实行人轮廓来表达"行人"的先验形状,对Graph Cut分割算法予以约束,同时构建一个行人模板的层次树以减少匹配时间;并且提出一种区分性的外观模型来替换原来的外观模型。实验结果证明,该算法的分割结果明显优于传统Graph Cut算法的分割结果,所得到的轮廓与真实的行人轮廓比较吻合。 展开更多
关键词 行人分割 graph Cut算法 层次聚类 Chamfer距离 形状约束
在线阅读 下载PDF
上一页 1 2 52 下一页 到第
使用帮助 返回顶部