摘要
提出一种改进的KNN算法,并将其用于垃圾邮件的过滤问题。经实验证明,改进的算法能够降低K值和训练文本的分布对过滤效果的影响,减少垃圾邮件的误判和漏判,具有较好的过滤性能。
In this paper, an improved K - Nearest Neighbor (KNN) is proposed and is applied to filter spam email. It's proved that the improved algorithm is less sensitive to the parameter K and the distribution of the training set, helps reducing the misclassification, and performances well in experiments.
出处
《现代图书情报技术》
CSSCI
北大核心
2007年第4期75-78,共4页
New Technology of Library and Information Service
基金
2006年国家社科基金项目"网络信息过滤研究"(项目编号:06BTQ024)的研究成果之一