基于节点聚集系数的分布式标签传播算法被引量：3

DISTRIBUTED LABEL PROPAGATION ALGORITHM BASED ON NODES CLUSTERING COEFFICIENT

下载PDF

导出

摘要随着互联网的发展和普及,越来越多的用户加入到社交网络,逐渐形成了大规模、多样化的社区。对于新浪微博等社交服务来说,这些社区的发现可以为用户和商家提供有价值的信息。在社区发现算法中,标签传播算法(LPA算法)具有算法思想简单、复杂度低、无需初始化社区数量等优点,但准确率较低,同时在大数据环境下,效率还不够高。将节点聚类系数引入LPA的标签更新过程中,提出一种结合MapReduce分布式计算框架的社区发现算法——DisLPA算法。实验表明,该算法不仅提高了准确率,同时有效改善了计算瓶颈问题。 Along with the development and popularity of Internet,more and more users join in social networks,and this gradually forms the large-scale and diverse communities. For social networking services such as Sina microblogging,the detection of these communicates can offer valuable information to users and merchants. Among numerous community detection algorithms,the label propagation algorithm（ LPA） has the advantages of simple algorithm idea,low complexity,and no need in initialising the numbers of community,etc. However,its accuracy is rather lower,and meanwhile its efficiency is not high enough in the environment of big data. We proposed a community detection algorithm,which combines MapReduce distributed computation framework,by introducing nodes clustering coefficient into the process of LPA label update,we call it DisLPA. Experiment showed that the algorithm not only improved the accuracy,but also effectively solved the bottleneck problem of calculation.

作者张素智孙嘉彬王威

机构地区郑州轻工业学院计算机与通信工程学院

出处《计算机应用与软件》 CSCD 2016年第4期125-128,142,共5页 Computer Applications and Software

基金国家自然科学基金项目(61201447)

关键词社区发现标签传播聚集系数 MAPREDUCE Community detection Label propagation Clustering coefficient MapReduce

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献19

1覃雄派,王会举,杜小勇,王珊.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45. 被引量：386
2Watts D J,Strogatz S H.Collective dynamics of‘small-world’networks[J].nature,1998,393(6684):440-442.
3Adamic L A,Huberman B A.Power-law distribution of the world wide web[J].Science,2000,287(5461):2115-2115.
4Girvan M,Newman M E J.Community structure in social and biological networks[J].Proceedings of the National Academy of Sciences of the United States of America,2002,99(12):7821-7826.
5刘大有,金弟,何东晓,黄晶,杨建宁,杨博.复杂网络社区挖掘综述[J].计算机研究与发展,2013,50(10):2140-2154. 被引量：72
6Raghavan U N,Albert R,Kumara S.Near linear time algorithm to detect community structures in large-scale networks[J].Physical Review E,2007,76(3):036106.
7陶剑文,Fu-Lai CHUNG,王士同,姚奇富.稀疏近似最近特征空间嵌入标签传播[J].软件学报,2014,25(6):1239-1254. 被引量：3
8王庚,宋传超,盛玉晓,王童童,李盛恩.基于标签传播的稳定重叠社区挖掘算法研究[J].山东科学,2013,26(5):61-68. 被引量：3
9赵雅端,卢罡,赵英,山岚.基于GPU的复杂网络社区挖掘算法并行计算[J].计算机应用研究,2013,30(8):2426-2428. 被引量：2
10宋钰,何小利.一种基于日志聚类邮件网络社区划分挖掘算法[J].科技通报,2014,30(2):96-98. 被引量：1

二级参考文献203

1陈绍宇,宋佳兴,刘卫东,王诚.关系网格:一种基于小世界模型的社会关系网络[J].计算机应用研究,2006,23(5):194-197. 被引量：14
2Zhou MQ, Zhang R, Zeng DD, Qian WN, Zhou AY. Join optimization in the MapReduce environment for column-wise data store. In: Fang YF, Huang ZX, eds. Proc. of the SKG. Ningbo: IEEE Computer Society, 2010.97-104. [doi: 10.1109/SKG.2010.18].
3Afrati FN, Ullman JD. Optimizing joins in a Map-Reduce environment. In: Manolescu I, Spaecapietra S, Teubner J, Kitsuregawa M, Leger A, Naumann F, Ailamaki A, Ozcan F, eds. Proc. of the EDBT. Lausanne: ACM Press, 2010. 99-110. [doi: 10.1145/ 1739041.1739056].
4Sandholm T, Lai K. MapReduce optimization using regulated dynamic prioritization. In: Douceur JR, Greenberg AG, Bonald T, Nieh J, eds. Proc. of the SIGMETRICS. Seattle: ACM Press, 2009. 299-310. [doi: 10.1145/1555349.1555384].
5Hoefler T, Lumsdaine A, Dongarra J. Towards; efficient MapReduce using MPI. In: Oster P, ed. Proc. of the EuroPVM/MPI. Berlin: Springer-Verlag, 2009. 240-249. [doi: 10.100'7/978-3-642-03770-2_30].
6Nykiel T, Potamias M, Mishra C, Kollios G, Koudas N. MRShare: Sharing across multiple queries in MapReduce. PVLDB, 2010, 3(1-2):494-505.
7Kambatla K, Rapolu N, Jagannathan S, Grama A. Asynchronous algorithms in MapReduce. In: Moreira JE, Matsuoka S, Pakin S, Cortes T, eds. Proc. of the CLUSTER. Crete: IEEE Press, 2010. 245-254. [doi: 10.1109/CLUSTER.2010.30].
8Polo J, Carrera D, Becerra Y, Torres J, Ayguad6 E, Steinder M, Whalley I. Performance-Driven task co-scheduling for MapReduce environments. In: Tonouchi T, Kim MS, eds. Proc. of the 1EEE Network Operations and Management Symp. (NOMS). Osaka: IEEE Press, 2010. 373-380. [doi: 10.1109/NOMS.2010.5488494].
9Zaharia M, Konwinski A, Joseph AD, Katz R, Stoica I. Improving MapReduce performance in heterogeneous environments. In: Draves R, van Renesse R, eds. Proc. of the ODSI. Berkeley: USENIX Association, 2008.29-42.
10Xie J, Yin S, Ruan XJ, Ding ZY, Tian Y, Majors J, Manzanares A, Qin X. Improving MapReduce performance through data placement in heterogeneous Hadoop clusters. In: Taufer M, Rfinger G, Du ZH, eds. Proc. of the Workshop on Heterogeneity in Computing (IPDPS 2010). Atlanta: IEEE Press, 2010. 1-9. [doi: 10.1109/IPDPSW.2010.5470880].

共引文献460

1郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.
2谢月锋,董现垒,陈卉,王燕,刘志成.利用网络痕迹信息即时预测儿童腹泻流行趋势[J].医学信息（医学与计算机应用）,2016,29(29):1-4.
3董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量：72
4邓波,张玉超,金松昌,林旺群.基于MapReduce并行架构的大数据社会网络社团挖掘方法[J].计算机研究与发展,2013,50(S2):187-195. 被引量：10
5马宾.一种改进的并行K_近邻网络舆情分类算法研究[J].微电子学与计算机,2015,32(6):62-66. 被引量：1
6樊伟红,李晨晖,张兴旺,秦晓珠,郭自宽.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,31(11):63-68. 被引量：238
7于薇.“大数据”背景下的信息处理技术分析与研究[J].数字图书馆论坛,2012(11):6-11. 被引量：3
8向剑平,乔少杰,胡剑.WMB*:一种提高大数据上软件执行效率改进算法[J].内江师范学院学报,2012,27(12):24-28. 被引量：4
9徐翔,邹复民,廖律超,朱铨.基于GemFire的海量数据计算性能实验分析[J].计算机应用,2013,33(1):226-229. 被引量：5
10黄晓斌,钟辉新.大数据时代企业竞争情报研究的创新与发展[J].图书与情报,2012(6):9-14. 被引量：120

同被引文献8

1智源,行飞.复杂网络社区结构问题综述[J].阴山学刊（自然科学版）,2011,25(3):31-34. 被引量：2
2杨楠,弓丹志,李忺,孟小峰.Web社区发现技术综述[J].计算机研究与发展,2005,42(3):439-447. 被引量：35
3黄健斌,钟翔,孙鹤立,茆婉婷.基于相似性模块度最大约束标记传播的网络社团发现算法[J].北京大学学报（自然科学版）,2013,49(3):389-396. 被引量：6
4石立新,张俊星.一种稳定的标签传播社区发现算法[J].计算机应用与软件,2015,32(3):261-265. 被引量：1
5李磊,倪林.基于模块度优化的标签传播社区发现算法[J].计算机系统应用,2016,25(9):212-215. 被引量：11
6张超,武先强,董荣胜.一种改进的基于相干邻居亲近度的标签传播算法[J].广西科学院学报,2017,33(1):12-18. 被引量：1
7徐成林,陈志刚,黄瑞,龙增艳,李博,周清清,邓伊琴.用于社区发现的LPA_LRDC标签传播算法[J].小型微型计算机系统,2017,38(8):1746-1750. 被引量：7
8宋琛,张贤坤,费松,荚佳,刘栋.基于随机游走相似度矩阵的改进标签传播算法[J].计算机应用与软件,2016,33(8):269-272. 被引量：5

引证文献3

1宁念文,许合利,刘喜峰.基于资源分配指标的最大约束社区发现算法[J].计算机应用与软件,2017,34(7):217-221. 被引量：1
2阎海玲.复杂网络社区发现方法综述[J].信息与电脑,2018,30(20):162-163. 被引量：2
3阎海玲,周瑞,袁春艳.基于标签传播算法的Web社区发现研究[J].电脑知识与技术,2018,14(1Z):254-256.

二级引证文献3

1宫义山,穆明珠.基于复杂网络的社区划分算法分析[J].长江信息通信,2021(2):86-89.
2任薇,阮淇昱,韩孟凯,邱玉辉.一种基于语义推理的网络社区发现模型[J].西南大学学报（自然科学版）,2022,44(9):178-186. 被引量：1
3姚鑫宇,肖玉芝,赵洪凯.一种基于链路优化的社团挖掘算法及其应用[J].计算机应用与软件,2023,40(8):32-37. 被引量：1

1陈晶,万云.社交网络中基于模块度最大化的标签传播算法的研究[J].通信学报,2017,38(2):25-33. 被引量：10
2苗海飞,陈晓云,程建军,马涛.基于LPA和频繁项集的社团检测方法[J].宁夏师范学院学报,2016,37(6):67-76.
3甲骨文发布业界涵盖最广阔的云战略[J].网管员世界,2012(13):11-11.
4全智.中芬联手推出移动社交服务[J].军民两用技术与产品,2008(3):24-24.
5韩少腾.基于SaaS的去中心化SNS平台的设计与实现[J].软件,2012,33(11):105-108.
6刘纪政.基于Android操作系统的GIS软件开发与研究[J].计算机光盘软件与应用,2013,16(1):234-234. 被引量：3
7孙永杰.谷歌的微软综合症是否可取[J].软件和信息服务,2011(9):77-77.
8张燕平,汪洋,赵姝,段震,高兆远.基于覆盖的社团发现算法[J].南京大学学报（自然科学版）,2013,49(5):539-545. 被引量：2
9黄佳鑫,郭昆,郭红.融入节点重要性和标签影响力的标签传播社区发现算法[J].小型微型计算机系统,2015,36(6):1171-1175. 被引量：7
10夏磊,张乐君,国林,张勇实,张健沛,杨静.节点相似度标签传播在社会网络中的应用研究[J].计算机工程与应用,2014,50(14):103-109. 被引量：4

计算机应用与软件

2016年第4期

浏览历史

内容加载中请稍等...

基于节点聚集系数的分布式标签传播算法被引量：3

参考文献19

二级参考文献203

共引文献460

同被引文献8

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于节点聚集系数的分布式标签传播算法 被引量：3

参考文献19

二级参考文献203

共引文献460

同被引文献8

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于节点聚集系数的分布式标签传播算法被引量：3