摘要
提出了一种基于半监督学习的方法对Web流量进行聚类分析,使用隐马尔可夫模型对用户流量进行描述和聚类分析。该方法通过对少量数据进行人工标识,利用已标识数据对无监督聚类结果进行调整,以得到与人工分类匹配的聚类结果。使用真实的Web流量对提出的方法进行验证,实验结果表明该方法能有效地对Web流量进行分类,并得到相应的描述模型。
This paper presented a Web traffic classification method based on semi-supervised clustering, which uses HMM (Hidden Markov Model) to model and analyze Web client traffic. The method first runs an unsupervised clustering process on the whole data set,and then uses the pre-labeled data to adjust the result clusters. The paper also presented the experiment result on real network data to validate the purposed method.
出处
《计算机科学》
CSCD
北大核心
2009年第2期90-94,共5页
Computer Science
基金
国家高技术研究发展计划(863)资助项目(批准号:2007AA01Z449)
国家自然科学基金-广东联合基金重点项目(U0735002)
国家自然科学基金项目(90304011)资助