摘要
提出了一种基于支持向量机的文本自动分类方法,并进行了实验研究。在详细介绍了进行文本分类的实验过程和在实验中使用支持向量机的方法的基础上,通过实验比较了支持向量机算法和传统的KNN算法应用于文本分类的效果,并针对支持向量机算法的缺点,提出了进行文本预处理时的改进方法。实验结果表明了支持向量机在处理文本分类问题上的优越性。
A Chinese-text automatic classification method based on SVM is presented. After describing the experiment programming of text classification and how to use Support Vector Machine to text classification, we compare the experiment results of using SVM and using the traditional text-classification algorithm--KNN to Chinese-text automatic classification, and to counter shortcoming in SVM, a improved method for pre-processing text is proposed. It shows that the SVM is superior.
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2007年第3期475-478,共4页
Systems Engineering and Electronics
基金
上海市重点学科基金(T0502)
上海市教育委员会发展基金(05E233)资助课题