支持向量机的半监督网络流量分类方法被引量：6

Semi-supervised network traffic classification method based on support vector machine

下载PDF

导出

摘要针对传统网络流量分类方法准确率低、开销大、应用范围受限等问题,提出一种支持向量机(SVM)的半监督网络流量分类方法。该方法在SVM训练中,使用增量学习技术在初始和新增样本集中动态地确定支持向量,避免不必要的重复训练,改善因出现新样本而造成原分类器分类精度降低、分类时间长的情况;改进半监督Tri-training方法对分类器进行协同训练,同时使用大量未标记和少量已标记样本对分类器进行反复修正,减少辅助分类器的噪声数据,克服传统协同验证对分类算法及样本类型要求苛刻的不足。实验结果表明,该方法可明显提高网络流量分类的准确率和效率。 In order to solve low accuracy, large time consumption and limited application range in traditional network traffic classification, a semi-supervised network traffic classification method of Support Vector Machine （SVM） was proposed. During the training of SVM, it determined the support vectors from the initial and new sample set by using incremental learning technology, avoided unnecessary repetition training, and improved the situation of original classifiers＇ low accuracy and time- consuming as a result of new samples that appeared. This paper also proposed an improved Tri-training method to train multiple classifiers, and a large number of unlabeled samples and a small amount of labeled samples were used to modify the classifiers, which reduced auxiliary classifier＇ s noise data and overcame the strict limitation of sample types and traditional Co- verification for classification methods. The experimental results show that the proposed algorithm has excellent accuracy and speed in traffic classification.

作者李平红王勇陶晓玲

机构地区桂林电子科技大学计算机科学与工程学院桂林电子科技大学广西可信软件重点实验室桂林电子科技大学信息与通信学院

出处《计算机应用》 CSCD 北大核心 2013年第6期1515-1518,共4页 journal of Computer Applications

基金国家自然科学基金资助项目(61163058 61172053) 广西自然科学基金资助项目(2011GXNSFB018076)

关键词网络流量分类支持向量机半监督增量学习协同训练 network traffic classification Support Vector Machine （SVM） semi-supervised incremental learning Tri-training

分类号 TP393.07 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1LI W, CANIN M, MOORE A W. Efficient application identification and the temporal and spatial stability of classification schema[ J]. Computer Networks, 2009, 53(6):790-809.
2张宾,杨家海,吴建平.Internet流量模型分析与评述[J].软件学报,2011,22(1):115-131. 被引量：93
3MOORE A W, PAPAGIANNAKI K. Toward the accurate identifica- tion of network application[ C]//Proceedings of the 6th Internation- al Workshop on Passive and Active Network Measurement. Berlin: Springer-Verlag, 2005:41-54.
4THUY T T, ARMITAGE G. A survey of techniques for Internet traf- fic classification using machine learning[ J]. IEEE Communications Surveys and Tutorials, 2008, 10(4) : 56 - 76.
5徐鹏,林森.基于C4.5决策树的流量分类方法[J].软件学报,2009,20(10):2692-2704. 被引量：171
6贺玲,蔡益朝,杨征.高维数据聚类方法综述[J].计算机应用研究,2010,27(1):23-26. 被引量：43
7周伟达,张莉,焦李成.支撑矢量机推广能力分析[J].电子学报,2001,29(5):590-594. 被引量：56
8王晓丹,郑春颖,吴崇明,张宏达.一种新的SVM对等增量学习算法[J].计算机应用,2006,26(10):2440-2443. 被引量：21
9萧嵘,王继成,孙正兴,张福炎.一种SVM增量学习算法α-ISVM[J].软件学报,2001,12(12):1818-1824. 被引量：85
10曾文华,马健.一种新的支持向量机增量学习算法[J].厦门大学学报（自然科学版）,2002,41(6):687-691. 被引量：39

二级参考文献72

1滕月阳,唐焕文,张海霞.一种新的支持向量机增量学习算法[J].计算机工程与应用,2004,40(36):77-80. 被引量：7
2王兆霞,孙雨耕,陈增强,袁著祉.基于模糊神经网络的网络业务量预测研究[J].通信学报,2005,26(3):136-140. 被引量：17
3黄晓璐,闵应骅,吴起.网络流量的半马尔可夫模型[J].计算机学报,2005,28(10):1592-1600. 被引量：9
4洪飞,吴志美.基于小波的多尺度网络流量预测模型[J].计算机学报,2006,29(1):166-170. 被引量：46
5陆锦军,王执铨.基于混沌特性的网络流量预测[J].南京航空航天大学学报,2006,38(2):217-221. 被引量：25
6王升辉,裘正定.结合多重分形的网络流量非线性预测[J].通信学报,2007,28(2):45-50. 被引量：40
7刘杰,黄亚楼.基于BP神经网络的非线性网络流量预测[J].计算机应用,2007,27(7):1770-1772. 被引量：66
8Madhukar A, Williamson C. A longitudinal study of P2P traffic classification [C]//Proc of the 14th IEEE Int Syrup on Modeling, Analysis, and Simulation. Washington, DC IEEE Computer Society, 2006:179-188
9Moore A W, Papagiannaki K. Toward the accurate identification of network applications [G]//Dovrolis C. LNCS 3431: Proc of the PAM 2005. Heidelberg: Springer, 2005:41-54
10Karagiannis T, Papagiannaki K, Faloutsos M. BLINC: Multilevel traffic classification in the dark [C]//Proc of ACM SIGCOMM. New York: ACM, 2005.. 229-240

共引文献499

1高文才,曹帅.基于MRF-FCM算法的矿井运动目标图像优化[J].工矿自动化,2024,50(S01):69-73. 被引量：1
2邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：54
3代志康,吴秋新,程希明.一种基于ResNet的网络流量识别方法[J].北京信息科技大学学报（自然科学版）,2020,35(1):82-88. 被引量：5
4吴静,刘衍珩,孟凡雪.入侵检测中的多分类SVM增量学习算法[J].北京工业大学学报,2009,35(12):1697-1702. 被引量：3
5杨迎春.能想多远,就能走多远——上海利策投资管理公司总经理查大兵谈用人标准[J].成才与就业,2005(21):31-32.
6陈陆颖,丛蓉,杨洁,于华.P2P Streaming Traffic Classification in High-Speed Networks[J].China Communications,2011,8(5):70-78. 被引量：1
7赵树鹏,陈贞翔,彭立志.基于流中前5个包的在线流量分类特征[J].济南大学学报（自然科学版）,2012,26(2):156-160. 被引量：3
8孟姣,王丽宏,熊刚,姚垚.基于机器学习的SSH应用分类研究[J].计算机研究与发展,2012,49(S2):153-159. 被引量：2
9熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：25
10方向,丁兆军,舒新前.基于遗传算法优化的支持向量机(SVM-GA)低阶煤制氢产量预测模型[J].煤炭学报,2010,35(S1):205-209. 被引量：3

同被引文献127

1杜敏,陈兴蜀,谭骏.A Novel P2P Traffic Identification Algorithm Based on BPSO and Weighted KNN[J].China Communications,2011,8(2):52-58. 被引量：6
2孟姣,王丽宏,熊刚,姚垚.基于机器学习的SSH应用分类研究[J].计算机研究与发展,2012,49(S2):153-159. 被引量：2
3陈亮,龚俭,徐选.应用层协议识别算法综述[J].计算机科学,2007,34(7):73-75. 被引量：33
4彭芸,刘琼.Internet流分类方法的比较研究[J].计算机科学,2007,34(8):58-61. 被引量：17
5马丁.调查显示HTTP网络流量过去四年首超P2P[EB/OL].(2007-6-19)[2012-12-12].http://tech.sina.com.cn/i/2007-06-19/21001571600.shtml.
6蔡强.专家称P2P流量占国内总带宽过半宽带资源[EB/OL].(2007-6-6)[2012-12-12].http://it.sohu.com/20070606/n250414169.shtml.
7IPOQUE.Ipoque Internet study 2007:P2P file sharing still dominates world wide internet[EB/OL].(2007-11-28)[2012-12-12].http://www.ipoque.com/news&events/news/ipoque internet study 2007 p2p file sharing still dominates the worldwide internet.html.
8驱动之家.2008最新P2P流量监控与管理解决方案[EB/OL].(2008-2-27)[2012-12-12].http://tech.sina.com.cn/h/2008-02-27/1843588168.shtml.
9苗欣.移动互联网流量已逼近固定互联网[EB/OL].(2010-3-27)[2012-12-12].http://www.caopeng.net/2010/03/mobile-internet-traffic-has-been-close-to-the-?xedinternet/.
10中国市场调查网.全球移动互联网流量发展走势[EB/OL].(2011-11-27)[2012-12-12].http://www.cnscdc.com/touziredian/101841.html.

引证文献6

1胡雯,赵海廷.嵌入式在线视频监测流量控制方法研究与仿真[J].计算机仿真,2016,33(1):442-445. 被引量：5
2彭立志.互联网流量识别研究综述[J].济南大学学报（自然科学版）,2016,30(2):95-104. 被引量：13
3魏书宁,陈幸如,唐勇,刘慧.AR-HELM算法在网络流量分类中的应用研究[J].信息网络安全,2018(1):9-14. 被引量：5
4陈幸如,魏书宁.基于ELM的网络流量分类及可视化研究[J].安徽师范大学学报（自然科学版）,2018,41(2):129-134.
5王宣立,张安琳,黄道颖,董帅,刘江豪.SDN环境下不同机器学习算法的网络流量分类分析[J].轻工学报,2020,35(4):96-102.
6庞兴龙,朱国胜.基于半监督学习的网络流量分析研究[J].计算机科学,2022,49(S01):544-554. 被引量：10

二级引证文献33

1欧仁侠,张华磊,陈洪斌.有色金属铸造车间嵌入式监测系统研究[J].世界有色金属,2016,41(9):114-115. 被引量：1
2谭红春,耿英保,马春.校园网流量采集与P2P特征码的提取[J].齐鲁工业大学学报,2016,30(4):75-80.
3严星.关于局部网络传输信息流实时控制仿真研究[J].计算机仿真,2018,35(5):270-273. 被引量：2
4魏书宁,陈幸如,焦永,王进.AR-OSELM算法在网络入侵检测中的应用研究[J].信息网络安全,2018(6):1-6. 被引量：3
5祝恩国,窦健,韩霄汉,王朝亮.用电信息采集接口测试数据传输请求量动态调整策略[J].济南大学学报（自然科学版）,2018,32(4):310-315. 被引量：2
6赵旭,黄光球,崔艳鹏,王明明.基于改进选择算子的NIDS多媒体包多线程择危处理模型[J].信息网络安全,2018(10):45-50.
7原虹.用于有色金属铸造车间的嵌入式监测系统设计[J].世界有色金属,2016,41(12S):87-88.
8李致远.ARES P2P资源共享协议分析技术研究[J].计算机工程与应用,2016,52(24):1-5. 被引量：1
9何杭松.基于Xgboost算法的Shadowsocks流量识别研究[J].软件导刊,2018,17(12):200-203. 被引量：7
10陈良臣,高曙,刘宝旭,卢志刚.网络加密流量识别研究进展及发展趋势[J].信息网络安全,2019(3):19-25. 被引量：33

1林荣强,李鸥,李青,李林林.基于类标记扩展的半监督网络流量特征选择算法[J].计算机应用,2014,34(11):3206-3209. 被引量：1
2刘宁.一种半监督网络入侵检测系统SSIDS-CV[J].计算机与数字工程,2015,43(4):648-651.
3王宇,余顺争.网络流量的决策树分类[J].小型微型计算机系统,2009,30(11):2150-2156. 被引量：8
4邹伟锋,朱兆达.空间距离变换的彩色图像目标识别方法[J].南京航空航天大学学报,2007,39(5):601-606.
5栾静,顾君忠.模型驱动的嵌入式系统设计与性能优化[J].计算机工程与应用,2006,42(14):114-117. 被引量：3
6郑洪英,倪霖.一种无监督网络入侵检测算法[J].计算机工程,2008,34(18):184-185. 被引量：1
7陆云飞.C函数的参数综析[J].中国科技信息,2006(19):279-280.
8杨英.新网络软件[J].管理观察,1996,0(6):41-41.
9李平红,王勇,陶晓玲.基于成对约束扩展的半监督网络流量特征选择算法[J].传感器与微系统,2013,32(5):146-149. 被引量：5
10李平红,陶晓玲,王勇.一种混合约束的半监督网络流量特征选择方法[J].计算机仿真,2013,30(9):256-260. 被引量：4

计算机应用

2013年第6期

浏览历史

内容加载中请稍等...

支持向量机的半监督网络流量分类方法被引量：6

参考文献14

二级参考文献72

共引文献499

同被引文献127

引证文献6

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

支持向量机的半监督网络流量分类方法 被引量：6

参考文献14

二级参考文献72

共引文献499

同被引文献127

引证文献6

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

支持向量机的半监督网络流量分类方法被引量：6