用于文本分类的多核SVM算法研究被引量：3

Algorithm Research on Multiple Kernel Learning SVM for Text Classification

下载PDF

导出

摘要根据文本分类通常包含多异类数据源的特点,提出了多核SVM学习算法。该算法将分类核矩阵的二次组合重新表述成半无限规划,并说明其可以通过重复利用SVM来实现有效求解。实验结果表明,提出的算法可以用于数百个核的结合或者是数十万个样本的结合,对于多异类数据源的文本分类具有较高的查全率和查准率。 According to the feature of text classification which often involves multiple, heterogeneous data sources, this paper puts forward the algorithm of multiple kernel learning. It considers that conic combinations of kernel matrices for classification leads to a convex quadratically constraint quadratic program, and it can be efficiently solved by recycling the standard SVM implementations. Experimental results show that the proposed algorithm works for hundred thousands of examples or hundreds of kernels to be combined, and it has higher recall rate and higher precision rate for classification of text email with multiple, heterogeneous data sources.

作者陈莲娜姚伏天

机构地区中国计量学院计算机科学系

出处《计算机工程》 CAS CSCD 北大核心 2007年第9期196-198,共3页 Computer Engineering

基金浙江省科技厅基金资助项目(2005D40089)

关键词文本分类 SVM 多核学习 Text classification SVM Multiple kernel learning

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Bach F R,Lanckriet R G,Jordan M I.Multiple Kernel Learning,Conic Duality,and the SMO Algorithm[C]//Proc.of the 21st International Conference on Machine Learning.2004.
2Chapelle O,Vapnik V,Bousquet O,et al.Choosing Multiple Parameters for Support Vector Machines[J].Machine Learning,2002,46(1):131-159.
3Grandvalet I,Canu S.Adaptive Scaling for Feature Selection in SVMs[J].Advances in Neural Information Processing Systems,2002,13(2):150-176.
4Hettich R,Kortanek K O.Semi-infinite Programming:Theory,Methods and Applications[J].SIAM Review,1993,35(3):380-429.

同被引文献32

1祁亨年.支持向量机及其应用研究综述[J].计算机工程,2004,30(10):6-9. 被引量：196
2代六玲,黄河燕,陈肇雄.一种文本分类的在线SVM学习算法[J].中文信息学报,2005,19(5):11-15. 被引量：13
3郑小霞,钱锋.高斯核支持向量机分类和模型参数选择研究[J].计算机工程与应用,2006,42(1):77-79. 被引量：41
4李程雄,丁月华,文贵华.SVM-KNN组合改进算法在专利文本分类中的应用[J].计算机工程与应用,2006,42(20):193-195. 被引量：25
5应伟,王正欧,安金龙.一种基于改进的支持向量机的多类文本分类方法[J].计算机工程,2006,32(16):74-76. 被引量：28
6张博锋,苏金树,徐昕.一种新的多类SVM方法及其在文本分类中的应用[J].广西师范大学学报（自然科学版）,2006,24(4):95-98. 被引量：9
7闵锦,黄萱菁.基于主题和态度分类的文本过滤系统[J].计算机工程,2007,33(2):163-164. 被引量：6
8张永,周振龙,侯莉莉,张世宏.使用增量SVM进行文本分类[J].兰州理工大学学报,2007,33(1):100-103. 被引量：6
9印鉴,梅芳,张钢,任江涛.基于先验知识下支持向量机P-SVM的分类算法[J].小型微型计算机系统,2007,28(3):474-478. 被引量：2
10曹建芳,王鸿斌.基于SVM和统计的搜索引擎的设计[J].计算机工程与设计,2007,28(9):2138-2141. 被引量：2

引证文献3

1王彦明,奉永桃,奉国和.1999-2008年我国SVM文本分类文献计量分析[J].图书情报工作,2009,53(20):106-109. 被引量：2
2李妩可,郭赛球,尹艳.命名实体关系抽取算法的改进[J].计算机工程,2010,36(24):289-290. 被引量：2
3王治锋,毛启容,詹永照.基于特征分组的多核融合在线自适应识别算法[J].小型微型计算机系统,2013,34(3):585-589. 被引量：1

二级引证文献5

1姚全珠,王美君,李如琼.基于子树特征的中文实体关系抽取[J].计算机工程,2012,38(1):48-50. 被引量：1
2胡红宇,奉国和.大样本支持向量机分类策略研究[J].微计算机信息,2012,28(4):22-23.
3王江涛,石红岩,温新竹.无线视觉传感网络中身份特征自适应识别[J].计算机仿真,2016,33(3):254-257. 被引量：1
4阳小华,张硕望,欧阳纯萍.中文关系抽取技术研究[J].南华大学学报（自然科学版）,2018,32(1):66-72. 被引量：3
5陈海红.多核SVM文本分类研究[J].软件,2015,36(5):7-10. 被引量：28

1周若谷.Sql server与异类数据源数据传输研究[J].信息与电脑（理论版）,2009(10):87-87. 被引量：1
2杨静宇,魏兴国,孙怀江.一种快速SVM学习算法[J].南京理工大学学报,2003,27(5):530-535. 被引量：6
3吕宏伟.一种改进的半监督增量SVM学习算法[J].科学技术与工程,2010,10(1):238-240.
4刘忠民.异类数据源导入导出的技术实现[J].郑州铁路职业技术学院学报,2005,17(2):42-43.
5朱利娜.分布式数据查询技术的实现与分析[J].信阳师范学院学报（自然科学版）,2007,20(3):364-367. 被引量：1
6叶菲,罗景青,俞志富.一种改进的并行处理SVM学习算法[J].微电子学与计算机,2009,26(2):40-43. 被引量：6
7牟少敏,田盛丰,尹传环.基于协同聚类的多核学习[J].北京交通大学学报,2008,32(2):10-13. 被引量：4
8张仁峰,吴小俊,陈素根.通用稀疏多核学习[J].计算机应用研究,2016,33(1):21-27. 被引量：3
9张艳,兰光华,郁生阳,杨静宇.一种快速SVM学习算法[J].计算机工程与应用,2006,42(32):36-38. 被引量：2
10张军.基于遗传算法的频繁项挖掘算法[J].计算机工程与应用,2008,44(12):161-165. 被引量：2

计算机工程

2007年第9期

浏览历史

内容加载中请稍等...

用于文本分类的多核SVM算法研究被引量：3

参考文献4

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

用于文本分类的多核SVM算法研究 被引量：3

参考文献4

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

用于文本分类的多核SVM算法研究被引量：3