期刊文献+

基于支持向量机的中文文本自动分类研究 被引量:14

Research of chinese-text automatic classification based on SVM
在线阅读 下载PDF
导出
摘要 提出了一种基于支持向量机的文本自动分类方法,并进行了实验研究。在详细介绍了进行文本分类的实验过程和在实验中使用支持向量机的方法的基础上,通过实验比较了支持向量机算法和传统的KNN算法应用于文本分类的效果,并针对支持向量机算法的缺点,提出了进行文本预处理时的改进方法。实验结果表明了支持向量机在处理文本分类问题上的优越性。 A Chinese-text automatic classification method based on SVM is presented. After describing the experiment programming of text classification and how to use Support Vector Machine to text classification, we compare the experiment results of using SVM and using the traditional text-classification algorithm--KNN to Chinese-text automatic classification, and to counter shortcoming in SVM, a improved method for pre-processing text is proposed. It shows that the SVM is superior.
出处 《系统工程与电子技术》 EI CSCD 北大核心 2007年第3期475-478,共4页 Systems Engineering and Electronics
基金 上海市重点学科基金(T0502) 上海市教育委员会发展基金(05E233)资助课题
关键词 文本分类 支持向量机 特征提取 text classification SVM feature selection
  • 相关文献

参考文献15

二级参考文献63

  • 1范金城,胡峰.动态测量数据的抗扰性分析研究[J].数理统计与应用概率,1996,11(3):244-248. 被引量:25
  • 2邹涛.基于WWW的信息发现技术研究(博士学位论文)[M].南京:南京大学,1999..
  • 3袁曾任.人工神经元网络及其应用[M].北京:清华大学出版社,2000..
  • 4李辉.支撑向量机及其在文本分类中的应用,北京大学博士论文[M].,2001..
  • 5Peter Cord等 邵维忠等(译).Object-Oriented Analysis.Yourdon Press[M].北京:北京大学出版社,1992.65-77.
  • 6HANJIAWEI MICHELINEKAMBER.DataMiningconceptsandtechniques[M].北京:高等教育出版社,2001..
  • 7C Cortes, V N Vapnik. Support vector networks. Machine Learning, 1995, 20(3): 273-297
  • 8C Burges. A tutorial on support vector machines for pattern recongnition. Data Mining and Knowledge Discovery, 1998, 2(2): 1~43
  • 9T Joachims. Text categorization with support vector machines:Learning with many relevant features. In: C Nedellec ed. Proc of ECML-98. Heidelberg: Springer-Verlag, 1998. 137~142
  • 10E Leopold, J Kindermann. Text categorization with support vector machines, How to represent texts in input space? Machine Learning, 2002,46(1-3): 423~444

共引文献323

同被引文献143

引证文献14

二级引证文献63

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部