期刊文献+

文本分类中一种改进的特征选择方法 被引量:9

An Improved Feature Selection Method in Text Classification
在线阅读 下载PDF
导出
摘要 本文提出了一种改进的基于互信息的特征选择方法,与改进的TF-IDF权值公式相结合对文本特征进行选择,提高了特征项信息利用效率。试验表明,该算法提高了文本分类正确率。 In this paper, we put forward an improved feature selection method that based on MI. Combined with the improved weighting formula TF - IDF to select text feature, we have increased the using efficiency about the character information. The experiment shows that this method has improved the precision of the text classification.
出处 《情报科学》 CSSCI 北大核心 2007年第10期1534-1537,共4页 Information Science
关键词 信息增益 互信息 信息比值 特征选择 文本分类 information gain multi - information information ratio feature selection text classification
  • 相关文献

参考文献12

二级参考文献68

  • 1王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量:21
  • 2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:98
  • 3王煜,王正欧.基于模糊决策树的文本分类规则抽取[J].计算机应用,2005,25(7):1634-1637. 被引量:13
  • 4黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 5鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 6卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 7黄萱菁 吴立德.独立于语种的文本分类方法[C]..2000International Conference on Multilingual Information Processing[C].,2000..
  • 8Yiming Yang, An evaluation of statistical approaches to text categorization[J]. In:Journal of Information Retrieval,1999,1(2) :67 - 88.
  • 9Jian-yun Nie, Jianfeng Gao etc. On the Use of Words and N-grams for Chinese Information Retrieval[A]. Fifth International Workshop on Information Retrieval with Asian Languages [ C ]. Hong Kong, September 30 - October 1,2000.
  • 10James Auen.Natural Language Understandin[M].The Benjamin/Cummings Publishing Company, 1991-05.

共引文献884

同被引文献63

引证文献9

二级引证文献39

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部