期刊文献+

Boosting算法在文本自动分类中的应用 被引量:7

Application of Boosting Algorithm to Auto Text Categorization
在线阅读 下载PDF
导出
摘要 随着网络信息的迅猛发展 ,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用 Boosting算法经过试验证明是有效的 。 How to quickly and efficiently discover and acquire useful information is becoming increasingly important for web based information processing. Text categorization, the automated assigning of natural language texts to predefined categories, is a task of current interest in information querying and retrieval. The Boosting algorithm based on machine learning has gained popularity in recent years. The application of this algorithm to text categorization is proved to be effective and outperforms most of other alogrithms in text categorization.
作者 肖江 张亚非
出处 《解放军理工大学学报(自然科学版)》 EI 2003年第2期25-28,共4页 Journal of PLA University of Science and Technology(Natural Science Edition)
关键词 文本自动分类系统 自然语言处理 BOOSTING算法 机器学习 文本类别 分类器 text categorization natural language processing boosting algorithm machine
  • 相关文献

参考文献1

二级参考文献8

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 5鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 6卜东波,博士学位论文,2000年
  • 7Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 8Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页

共引文献294

同被引文献33

  • 1程泽凯 ,林士敏 .文本分类器准确性评估方法[J].情报学报,2004,23(5):631-636. 被引量:13
  • 2程泽凯,林士敏,陆玉昌,蒋望东,陆小艺.基于Matlab的贝叶斯分类器实验平台MBNC[J].复旦学报(自然科学版),2004,43(5):729-732. 被引量:27
  • 3崔林,付克明,石生树,宋瀚涛.基于Boosting机制的Naive Bayesian文本分类器[J].计算机工程与应用,2005,41(8):31-33. 被引量:3
  • 4董乐红,耿国华,周明全.基于Boosting算法的文本自动分类器设计[J].计算机应用,2007,27(2):384-386. 被引量:13
  • 5Chia-Hui Chang, Mohammed Kayed, Moheb Ramzy Girgis. A survey of web information extraction systems[J].IEEE Transactions on Knowledge and Data Engineering,2006,18(10): 1411- 1428.
  • 6Laender A H F, Ribeiro-Neto B A, Silva A S da, et al. A brief survey of web data extraction tools[J].SIGMOD Record,2002,31 (2):84-93.
  • 7Wang Zi-Qiang,Stm Xia,Zhang De-Xian,et al.An optimal SVM- Based Text Classification Algorithm [C]. International Conference on Machine Leaming and Cybernetics, 2006:1378-1381.
  • 8Lewis D D. Naive (Bayes) at forty: The independence assumption in information retrieval[C].Chemnitz, Germany: Proceedings of 10th European Conference on Machine Learning, 1998.
  • 9Han Jiawei, Micheline Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers. 2000.
  • 10Fabrizio Sebastiani. Machine Learning in automated text categorization. Journal of the ACM (JACM), 2002,34 (1) :1 - 47.

引证文献7

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部