基于聚类分析的P2P流量识别被引量：3

P2P traffic identification based on cluster analysis

下载PDF

导出

摘要通过使用聚类分析的方法来进行P2P的流量识别.首先给出P2P流量的特征,接着定义聚类特征树,然后通过扫描从网络中截得的数据得到相应的初始聚类树,最后计算初始聚类的贝叶斯信息准则值得到最终聚类结果.该方法能有效利用存储空间,避免了存储所有数据对象.同时还能够根据数据特征自动得到聚类数目,减少人为因素的影响,与K均值算法相比较优. Currently P2P traffic identification problem has been a focus and it is a prerequisite for effective management of P2P traffic in order to manage the network better.Traditional identification methods are no longer effective and this paper uses cluster analysis approach to identify P2P traffic.Given the characteristics of P2P traffic,the clustering feature tree is defined,by calculating the data which is scanned from the network,we obtain the corresponding initial tree.The calculation of the BIC of initial clusters is desirable to the final clustering results.This method with the use of storages space is effective,avoiding the storage of the data objects,at the same time it is able to automatically cluster the data by features,and it reduces the influence of human factors,being optimum compared with the K-Means algorithm.

作者赵凯史长琼张理阳

机构地区长沙理工大学计算机与通信工程学院

出处《长沙理工大学学报（自然科学版）》 CAS 2010年第3期58-62,共5页 Journal of Changsha University of Science and Technology:Natural Science

基金湖南省自然科学基金资助项目(09JJ6094)

关键词聚类分析贝叶斯信息准则 P2P流量识别 cluster analysis BIC P2P traffic identification

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1苏欣,杨建华,张大方,谢高岗.面向流量识别系统的聚类算法的比较与分析[J].计算技术与自动化,2008,27(3):1-6. 被引量：8
2冯少荣,肖文俊.基于密度的DBSCAN聚类算法的研究及应用[J].计算机工程与应用,2007,43(20):216-221. 被引量：37
3J Erman, M Arlitt, A Mahanti. Traffic classification using clustering algorithms [A]. Proceedings of ACM SIGCOMM Minenet Workshop[C]. Italy: Pisa,2006:281-286.
4P Cheeseman,J Strutz. Bayesian classification(autoclass) : theory and results advances in knowledge dis- eovery and data mining[M]. USA: AAI/MIT Press, 1996:153-180.
5沈富可,常潘,任肖丽.基于BP神经网络的P2P流量识别研究[J].计算机应用,2007,27(B12):44-45. 被引量：16
6T Karagiannis, A Broido, M Faloutsos, et al. Transport layer identification of P2P traffic[A]. Proceed- ings of Internet Measurement Conference[C]. Italy: Taormina, 2004 : 121-134.
7MichelineKamber,JiaweiHan.数据挖掘:概念与技术[M].北京:机械工业出版社,2007:251-252.
8忻凌,倪志伟,黄玲.基于数据流的BIRCH改进聚类算法[J].计算机工程与应用,2007,43(5):166-168. 被引量：6
9蒋盛益,李霞.一种改进的BIRCH聚类算法[J].计算机应用,2009,29(1):293-296. 被引量：27
10王晓斌,温春,石昭祥.基于贝叶斯信息准则的文本主题数估计[J].计算机工程,2009,35(7):183-185. 被引量：5

二级参考文献97

1姜华平,许洪国.基于数理统计原理的交通事故多发点识别[J].济南交通高等专科学校学报,2001,9(3):15-17. 被引量：6
2李江涛,姜永玲.P2P流量识别与管理技术[J].电信科学,2005,21(3):57-61. 被引量：43
3蒋盛益,李庆华.聚类分析中的差异性度量方法研究[J].计算机工程与应用,2005,41(11):146-149. 被引量：4
4朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报,2006,17(3):379-387. 被引量：52
5袁震东淇渊林武忠.数学建模[M].上海：华东师范大学出版社,1999..
6HANJ,KAMBERM.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2006.
7ZHANG TIAN, RAMAKRISHNAN R, LIVNY M. BIRCH: An efficient data clustering method for very large databases[ J]. ACM SIGMOD Record, 1996, 25(2) : 103 - 114.
8HUANG ZHEXUE. Extensions to the k-means algorithm for clustering large data sets with categorical values[ J], Data Mining and Knowledge Discovery, 1998, 2(3) : 283 - 304.
9MACQUEEN J. Some methods for classification and analysis of multivariate observations[ C]// Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley: University of California Press, 1967, 1 : 281 - 297.
10HUANG ZHEXUE. A fast clustering algorithm to cluster very large categorical data sets in data mining[ C]// Proceedings of SIGMOD Workshop on Research Issues on Data Mining and Knowledge Discovery. [S. l ] : ACM Press, 1997:1 -8.

共引文献92

1郭鹏飞,李海霞,常海艳,白柯鑫,张煜.基于大数据的海上目标隐性关联规则挖掘方法[J].网络安全与数据治理,2023,42(S01):71-77. 被引量：3
2郭威,唐慧丰.基于轨迹聚类的航空器轨迹模式挖掘研究[J].计算机应用研究,2020,37(2):416-420. 被引量：3
3姚明海,金喜子,赵连朋,王娜.基于模糊聚类的侦察数据分析方法[J].计算机工程与设计,2009,30(2):404-407. 被引量：2
4陆宇,岳昆,刘惟一.一种基于贝叶斯网的交通拥堵预测方法[J].云南大学学报（自然科学版）,2010,32(S1):355-363. 被引量：5
5李乐,陈鸿昶,李鹏.一种改进的基于密度的聚类算法[J].电子技术应用,2009,35(9):101-104. 被引量：2
6印桂生,于翔,宁慧.基于粗约简的数据流增量聚类算法[J].西南交通大学学报,2009,44(5):637-642. 被引量：2
7李贤,罗可.BIRCH混合属性数据聚类方法[J].计算机工程与应用,2009,45(30):123-125. 被引量：3
8何明波,谭政,宋迪,刘真祥.基于贝叶斯技术的P2P流量识别方法的研究[J].计算机与现代化,2009(11):67-69.
9袁雪美,王晖,张鑫,刘亚杰.P2P流量识别技术综述[J].计算机应用,2009,29(B12):11-15. 被引量：10
10孙艳凤,张顺颐.一种基于数据包大小和聚类算法的业务识别法[J].电信快报（网络与通信）,2010(2):26-28.

同被引文献34

1王宗善,冷飞,季晶晶.高校数字化校园建设的探索与实践[J].实验室研究与探索,2010,29(5):162-164. 被引量：29
2杨林,刘聪,徐慧,张宵龙.P2P流实时识别技术研究[J].计算机科学,2012,39(S2):86-87. 被引量：3
3董旭,魏振军.一种加权欧氏距离聚类方法[J].信息工程大学学报,2005,6(1):23-25. 被引量：33
4张新刚,刘妍.防火墙技术及其在校园网络安全中的应用[J].网络安全技术与应用,2006(5):19-21. 被引量：17
5宫婧,孙知信,顾强.基于行为特征描述的P2P流识别方法的研究[J].小型微型计算机系统,2007,28(1):48-53. 被引量：5
6Sen S,Wang J. Analyzing peer-to-peer traffic across large networks [ J ]. IEEE/ACM Transactions on Networking, 2008,16 (2) : 219-232.
7Dan Wang, Qian Zhang, Jiang-ehuan Liu. Partial net- work coding: theory and application for continous sensor data collection[A]. The 15th IEEE Interna- tional Workshop on Quality of Service[C]. San Jose: IEEE Press,2009:93-101.
8Y Shu. Supporting complex queries in networks P2P [D]. Singapore: National University of Singapore, 2007.
9B Deb, S Bhatnagar, B Nath. ReInForm: reliable in- formation forwarding using multiple paths in sensor networks[A]. The 33rd IEEE International Confer- ence on Local Computer Networks[C]. Bonn: IEEE Press,2008:406-415.
10S Wang,Q H Vu,B C Ooi,et al. Skyframe a frame- work for skyline query processing in peer-to-peer systems[J]. The VLDB Journal,2009(18) :345-362.

引证文献3

1陈沅涛,左经文,夏卓群.基于P2P网络的可靠网络编码多路径协议[J].长沙理工大学学报（自然科学版）,2011,8(3):77-82.
2张新刚,孙飞显,王保平.数字化校园网络流量控制与优化[J].实验室研究与探索,2012,31(2):50-53. 被引量：5
3朱俚治.一种P2P数据流聚类的算法[J].计算机与数字工程,2016,44(8):1416-1419.

二级引证文献5

1高瞻.高校校园网P2P网络流量的监测与控制研究[J].数字技术与应用,2012,30(7):26-27.
2张新刚,田燕.数字化校园信息安全立体防御体系的探索与实践[J].实验技术与管理,2012,29(10):114-119. 被引量：17
3张小平.试论P2P网络流量控制管理若干关键技术[J].网络安全技术与应用,2013(11):37-37. 被引量：1
4秦晓慧.浅谈校园网P2P应用安全问题及防范的有效途径[J].电脑开发与应用,2014,27(6):53-56.
5田爱宝.高校多运营商网络出口策略的分析与研究[J].微型电脑应用,2017,33(12):58-60. 被引量：6

1储岳中.一类基于贝叶斯信息准则的k均值聚类算法[J].安徽工业大学学报（自然科学版）,2010,27(4):409-412. 被引量：16
2邵峰晶,张斌,于忠清.多阈值BIRCH聚类算法及其应用[J].计算机工程与应用,2004,40(12):174-176. 被引量：17
3白志杰,李弼程,彭天强.基于BIC的新闻视频近似重复帧检测方法[J].计算机应用,2009,29(6):1694-1695.
4邸若海,高晓光,郭志高.基于改进BIC评分的贝叶斯网络结构学习[J].系统工程与电子技术,2017,39(2):437-444. 被引量：10
5许明,韩军伟,郭雷,尹文杰.利用模型选择确定视觉词袋模型中词汇数目[J].计算机工程与应用,2011,47(31):148-150. 被引量：3
6倪曼蒂,覃拥军.基于Web日志挖掘的用户模式识别研究[J].现代计算机,2013,19(11):14-17.
7陈绍彬,叶飞跃,刘佰强,金涛.食品HACCP分类的BIRCH算法[J].计算机工程,2008,34(23):59-61. 被引量：3
8于俊清,胡小强,孙凯.改进的音频混合分割方法[J].计算机辅助设计与图形学学报,2010,22(7):1174-1181. 被引量：4
9郭鹏,李乃祥,刘同海.基于进化MCMC的DBN学习算法[J].计算机工程,2011,37(10):143-145.
10谭立球,夏利民,谷士文.基于信息瓶颈算法的图像分割[J].计算机工程,2008,34(18):215-216.

长沙理工大学学报（自然科学版）

2010年第3期

浏览历史

内容加载中请稍等...

基于聚类分析的P2P流量识别被引量：3

参考文献11

二级参考文献97

共引文献92

同被引文献34

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于聚类分析的P2P流量识别 被引量：3

参考文献11

二级参考文献97

共引文献92

同被引文献34

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于聚类分析的P2P流量识别被引量：3