期刊文献+

基于突发事件新闻网页的文本分类方法研究 被引量:1

Study on Text Classification Method Based on Accident News Webpage
在线阅读 下载PDF
导出
摘要 从对突发事件新闻结构特点的分析出发,进行了特定领域文本分类方法的探讨。其中根据文本特点,摒除信息量小的部分,将标题、首部等作为标引源,提高了分类速度。在特征抽取中综合考虑字与词对于文本分类的作用,提高了分类精度。 This paper discusses the special domain text classification method by analyzing the news structure of accident. It gets rid of the part that is not important according to the text characteristics and improves the speed of classification by using title and heading as source of reference. It improves the precision of classification by the integration of Chinese character feature and word feature in feature extraction.
机构地区 晋中学院
出处 《长治学院学报》 2006年第2期34-35,共2页 Journal of Changzhi University
关键词 文本分类 突发事件新闻 特征抽取 特征组合 text classification accident news feature extraction feature combination
  • 相关文献

参考文献2

二级参考文献6

共引文献63

同被引文献40

  • 1侯汉清,黄刚.电子计算机与文献分类[J].现代图书情报技术,1982(1):5-14. 被引量:10
  • 2周科进.网络媒体表现形式的集大成者:网络专题[J].新闻战线,2004(6):64-67. 被引量:23
  • 3宋丹,王卫东,陈英.基于改进向量空间模型的话题识别与跟踪[J].计算机技术与发展,2006,16(9):62-64. 被引量:23
  • 4杨丽英,李红娟,张永奎.突发事件新闻语料分类体系研究[C]//中文信息处理前言进展:中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议论文集.北京:清华大学出版社,2006:403-409.
  • 5Goosle.Google新闻的工作原理[EB/OL].[2013-04-18].http://support.google.corn/news/bin/topic.py?hl=zh-Hans&topic=2428790.
  • 6百度百科.新华网[EB/OL].[2013-04-18].http://baike.baidu.com/view/154954.htm.
  • 7Yang Yiming. An evaluation of statistical approaches to text categorization[ J]. Information Retrieval, 1999, 1 ( 1 - 2 ) : 69 -90.
  • 8Joachims T. Text categorization with support vector machines: Learning with many relevant features [ M ]. Berlin: Springer, 1998 : 137 - 142.
  • 9Lewis D D, Schapire R E, Callan J P, et al. Training algorithms for linear text classifiers [ C ]//Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Zurich : ACM, 1996:298 - 306.
  • 10新华网.我国新闻信息分类浅析[EB/OL].[2013-04-13].http://news.xinhuanet.com/new-media/2006-02/10/eontent_4160298.htm.

引证文献1

二级引证文献26

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部