期刊文献+

基于示例的文本标题分类机制 被引量:17

THE MECHANISM OF TEXT TITLE CLASSIFICATION BASED ON EXAMPLES
在线阅读 下载PDF
导出
摘要 文本分类有助于用户有选择地阅读和处理海量文本 ,给出了基于示例的文本标题分类机制 .它以具有确定分类标准的标题分类为应用背景 ,在计算标题与分类主题词表直接匹配的基础上 ,利用基于分类树的上位概念匹配机制和基于潜在语义空间的相似度判定 ,综合评价文本标题与类别的相关关系 .其特点是充分利用上下文环境来确定标题与类别相关程度 ,而不是单纯地依赖于其共现信息 . Text classification can help users selectively process huge volumes of texts in the Internet. Text title classification based on example texts is presented in this paper. It not only considers the direct matches between titles and the keyword sets of classes, but also takes into account the upper concept matches and semantic similarities. It uses vector space model as the representation for texts. It adopts the mechanism of indirect matches (upper concept matches), and calculates the similarities between texts and classes in a semantic space rather than term's space. As a result, it makes full use of the context ofKeywords instead of their frequencies, to determine the degree of correlation between keywords and classes.
作者 林鸿飞
出处 《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1132-1136,共5页 Journal of Computer Research and Development
关键词 潜在语义索引 文本标题分类 示例 信息处理 计算机 text classification, latent semantic indexing, vector space model, title classification
  • 相关文献

参考文献14

  • 1林鸿飞,战学刚,姚天顺.基于概念的文本结构分析方法[J].计算机研究与发展,2000,37(3):324-328. 被引量:36
  • 2陈磊.基于HNC语义分析的中文标题分类方法.计算语言学文集[M].北京:清华大学出版社,1999.371-375.
  • 3战学钢 姚天顺.基于汉语分析的中文标题分类方法.中文信息处理国际会议论文集[M].北京:清华大学出版社,1998.321-324.
  • 4林鸿飞,战学刚,姚天顺.基于潜在语义索引的文本分析方法[J].模式识别与人工智能,2000,13(1):47-51. 被引量:9
  • 5-.中国分类主题词表,分类号-主题词对应表,第一卷[M].北京:华艺出版社,1994..
  • 6-.中国分类主题词表,主题词-分类号对应表,第二卷[M].北京:华艺出版社,1994..
  • 7战学刚,林鸿飞,姚天顺.中文文献的层次分类方法[J].中文信息学报,1999,13(6):20-25. 被引量:22
  • 8战学钢,中文信息学报,1999年,13卷,6期,20页
  • 9陈磊,计算语言学文集,1999年,371页
  • 10战学钢,中文信息处理国际会议论文集,1998年,321页

二级参考文献11

共引文献61

同被引文献135

引证文献17

二级引证文献156

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部