期刊文献+

文本分类器性能评估指标 被引量:33

Performance Evaluation Metric for Text Classifiers
在线阅读 下载PDF
导出
摘要 讨论了用传统性能评估指标(精度和错误率)评估文本分类器时面临的困难,分析了目前几种常用的文本分类器性能评估指标:查 全率-查准率曲线、AUROC、F1值以及BEP值的优点与不足,并提出了两种新的可用于文本分类器的性能评估指标。 Afterdiscussing on the deficiency of accuracy and error rate as performance metrics for text categorization problems, this paper analyzes the strength and shortcoming of recall-precision curve, area under the ROC curve, F1value and break-even point, which are the most prevailing performance metrics for text classifiers, and proposes two kinds of new performance metric for text classifier.
作者 宋枫溪 高林
出处 《计算机工程》 CAS CSCD 北大核心 2004年第13期107-109,127,共4页 Computer Engineering
关键词 文本分类 性能评估 BEP值 ROC曲线 Text categorization Performance evaluation Breaks-even point Receiver operating characteristic curve
  • 相关文献

参考文献2

  • 1Sebastiani F. Machine Learning in Automated Text Categorization.ACM Computing Surveys, 2002, 34(1): 1-47
  • 2YANG Yiming. An Evaluation of Statistical Approaches to Text Categorization. Information Retrieval, 1999, 1(1-2): 69-903.周水庚.一个无须词典支持和切词处理的中文文档分类系统.计算机研究与发展,2001,38(7):839-844

同被引文献349

引证文献33

二级引证文献206

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部