期刊文献+

一种基于基尼指数和类内频率的特征选择方法

A kind of method to feature extration based on gini-index and frequency in kind
在线阅读 下载PDF
导出
摘要 使用基尼指数原理的"纯度"形式,结合类内频率的思想,构造了一个适合特征选择的特征评估函数GGNI(Category Gini-Index),在特征维数取不同值时,结合SVM、KNN两类分类器进行了分类试验,实验结果表明评估函数GGNI比其它常用的特征选择方法有较强的特征提取能力,可用于全局提取特征。
作者 郑伟 奉国和
出处 《制造业自动化》 北大核心 2010年第11期162-164,共3页 Manufacturing Automation
基金 国家社科基金项目"自动文本分类技术研究"(08CTQ003) 张家口市科学技术研究与发展项目"基于词性选的文本分类预处理方法研究"(0921045B)
  • 相关文献

参考文献9

  • 1Yang Y.An evaluation of statistical approaches to text categorization[J]. Information Retrieval, 1999,1:69-90.
  • 2Yang Y,Liu X.A re-examination of text categorization methods [C]/ / Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information ret rieval, 1999:42-49.
  • 3Yang Y,Pedersen J.A Comparative Study on Feature Selection in Text Categorization[C]/ / Proceedings of the 14th International conference on Machine Learning,1997:412- 420.
  • 4BREIMAN L,FR IEDMAN J.Classification and Regression Trees[M ]. Monterey:Wadsworth International Group,1984.
  • 5尚文倩,黄厚宽,刘玉玲,林永民,瞿有利,董红斌.文本分类中基于基尼指数的特征选择算法研究[J].计算机研究与发展,2006,43(10):1688-1694. 被引量:38
  • 6林永民,朱卫东.基尼指数在文本特征选择中的应用研究[J].计算机应用,2007,27(10):2584-2586. 被引量:5
  • 7S Shankar,G Karypisl A feature weight adjustment algorithm for document categorization[C]l The 6th ACM SIGKDD Int'lConf on knowledge discovery and data mining,Boston,MA,USA,2000.
  • 8C Charu, et all On the merits of building categorization system by supervised clustering[C]l The 5th ACM SIGKDD Int'lConf on Knowledge Discovery and Data Mining,San Diego ,California,USA, 1999.
  • 9段凤娟,朱吉胜,王华建.支持向量机快速算法的实现技术[J].现代计算机,2008,14(9):57-59. 被引量:3

二级参考文献44

共引文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部