摘要
使用基尼指数原理的"纯度"形式,结合类内频率的思想,构造了一个适合特征选择的特征评估函数GGNI(Category Gini-Index),在特征维数取不同值时,结合SVM、KNN两类分类器进行了分类试验,实验结果表明评估函数GGNI比其它常用的特征选择方法有较强的特征提取能力,可用于全局提取特征。
出处
《制造业自动化》
北大核心
2010年第11期162-164,共3页
Manufacturing Automation
基金
国家社科基金项目"自动文本分类技术研究"(08CTQ003)
张家口市科学技术研究与发展项目"基于词性选的文本分类预处理方法研究"(0921045B)