一种基于支持向量机和聚类的Web挖掘新方法

A New Method of Web Mining Based on Support Vector Machines and Clustering

下载PDF

导出

摘要针对日益增长的对Web数据挖掘的现状,本文提出了一种基于支持向量机和聚类的Web挖掘新方法,根据支持向量机中支持向量不会出现在两类样本集间隔以外的正确划分区的理论,通过引入聚类中的类质心、类半径、类质心距等概念,从而较好地解决快速而准确地删除非支持向量的问题,保证算法的泛化性。实验表明,采用这种改进的算法既能快速精确地对训练样本进行删减又较好地解决了泛化性问题。 For the growing of the status of Web data mining, this paper proposes a new approach of Web mining based on support vector machines and clustering, and taps new methods, according to the theory of correct divided areas that support vector will only appear in the interval of two types of sample collection, through the introduction of concepts of such as clustering center of mass, clustering radius and clustering eentroid distance, thus resolves better the problem of fast and accurately remove non-support vector to ensure the generalization of algorithm. The experimental results show that this improved algorithm not only can fast and precisely delete the training samples but also has a better solution to the issue of generalization.

作者苏意玲

机构地区华南师范大学南海校区实验中心

出处《计算机与现代化》 2009年第12期33-35,163,共4页 Computer and Modernization

关键词 WEB挖掘支持向量机聚类 Web mining support vector machine clustering

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Vapnik V N. An overview of statistical learning theory [ J ]. IEEE Transactions on Neural Networks, 1999, 10 ( 5 ) : 988 -999.
2Nello C, John S T. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods [ M ]. Cambridge University Press ,2000.
3李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
4郑春颖.一种改进的SVM算法[J].航空计算技术,2005,35(2):6-8. 被引量：6
5沈翠华,刘广利,邓乃扬.一种改进的支持向量分类方法及其应用[J].计算机工程,2005,31(8):153-154. 被引量：12
6李蓉,叶世伟,史忠植.SVM-KNN分类器——一种提高SVM分类精度的新方法[J].电子学报,2002,30(5):745-748. 被引量：135
7钟清流,蔡自兴.基于支持向量机的渐近式半监督式学习算法[J].计算机工程与应用,2006,42(25):19-22. 被引量：4

二级参考文献25

1李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
2Vapnik V N. An Overview of Statistical Learning Theory. IEEE Trans . on NN,1999,10(3): 988-999.
3Nello C,John S T. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. Cambridge University Press,2000.
4Nakaya A,Furuukawa H,Morishita S. Weighted Majority Decision Among Several Region Rules for Scientific Discovery. Discovery Science,1999: 17-29.
5Gestel T V. Benchmarking Least Squares Support Vector Machines Classifier. http://www. Citeseer. Nj.nec.com,2001.
6Meyer D,Leisch F,Hornik K. Benchmarking Support VectorMachines. http://www. wu-wien. Ac. at/am/download/report78. pdf,2002.
7Auer P,Burgsteiner H,Maass W. Reducing Communication for Distributed Learning in Neural Network. In Article Neural Neworks -ICANN 2001,Springer-Verlag,2001.
8M. Pontil and A. Verri. Support vector machines for 3-d object recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998,20(6):637-646.
9卢增祥李衍达.交互支持向量机学习算法及其应用[J].万方数据资源系统[DB].,1999.
10Hearst M.A., Dumais S.T., Osman E., Platt J., Scholkopf B.. Support vector machines. IEEE Intelligent Systems, 1998, 13(4): 18～28

共引文献198

1万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：68
2赵向军,路梅.垃圾邮件过滤算法研究[J].徐州师范大学学报（自然科学版）,2006,24(4):52-55. 被引量：1
3胡正平.基于模糊K近邻决策的柔性SVM分类算法[J].仪器仪表学报,2005,26(z2):384-386. 被引量：2
4李学勇,高国红,孙甲霞.基于互信息和K-means聚类的信息安全风险评估[J].河南师范大学学报（自然科学版）,2011,39(2):152-155.
5王淑盛,徐正光,刘黄伟,王志良,史立峰.改进的K近邻方法在岩性识别中的应用[J].地球物理学进展,2004,19(2):478-480. 被引量：16
6施洁斌.基于支持向量机的文本自动分类试验研究[J].现代图书情报技术,2004(7):27-29.
7张强,杨子龙,盛纲.浅谈SVM及其与KNN的联系[J].电脑知识与技术,2005(2):85-86.
8陈虎虎,钟方平,许学忠,董明荣.基于支持向量机的低空飞行目标声识别[J].系统工程与电子技术,2005,27(1):46-48. 被引量：11
9谭金波,李艺,杨晓江.文本自动分类的测评研究进展[J].现代图书情报技术,2005(5):46-49. 被引量：13
10王勋,凌云,费玉莲.基于Web日志和缓存数据挖掘的个性化推荐系统[J].情报学报,2005,24(3):324-328. 被引量：14

1刘鹏,孟海涛,陈笑蓉.一种提高SVM分类速度和泛化性的新方法[J].贵州大学学报（自然科学版）,2007,24(1):50-53. 被引量：1
2孟海涛,刘鹏.一种改进的SVM支持向量分类方法[J].现代电子技术,2007,30(1):150-152. 被引量：2
3刘学明,梁春兰,王学东.两轮驱动非完整约束机器人轨迹跟踪研究[J].制造业自动化,2013,35(16):84-87. 被引量：1
4张鑫,刘凤娟,闫茂德.基于动力学模型的轮式移动机器人自适应滑模轨迹跟踪控制[J].机械科学与技术,2012,31(1):107-112. 被引量：25
5张鑫,刘凤娟,闫茂德.参数不确定移动机器人全局轨迹跟踪的自适应滑模控制[J].微电子学与计算机,2011,28(7):132-135. 被引量：3
6梁铁柱,李建成,王晔.一种应用聚类技术检测网络入侵的新方法[J].国防科技大学学报,2002,24(2):59-63. 被引量：12
7邰滢滢,陈小惠.基于模糊聚类的数据关联融合算法[J].华东船舶工业学院学报,2003,17(6):58-62. 被引量：11
8李晓云.一类质心突变飞行器的重构容错控制(英文)[J].航天器工程,2009,18(3):29-35. 被引量：2
9王丽娜,马晓晓.一种改进的模糊聚类有效性指标[J].微电子学与计算机,2014,31(4):68-70. 被引量：4
10周剑,赵根林,黄有为.基于隐Markov模型的多节点融合决策并发故障诊断[J].计算机应用研究,2015,32(8):2447-2449. 被引量：2

计算机与现代化

2009年第12期

浏览历史

内容加载中请稍等...

一种基于支持向量机和聚类的Web挖掘新方法

参考文献7

二级参考文献25

共引文献198

相关作者

相关机构

相关主题

浏览历史