期刊文献+

基于K-近邻方法的科技文献分类 被引量:6

Academic Text Classification Based on K-Nearest Neighbor Method
在线阅读 下载PDF
导出
摘要 本文提出了一种在小样本数据下、无需分词处理的科技文献分类器建造方法.分析了科技文献的特点,提出了抽取科技文献的关键词作为分类特征词条,以文献的标题、关键词和摘要作为文档主题信息进行词频统计分析建立分类器.最后分别进行了基于最近邻决策和K-邻近决策的分类效果实验研究,实验证明基于欧氏距离相似性测度和基于余弦相似性测度的文本分类效果并不存在显著的差别,K-邻近决策的分类效果要优于最近邻决策的分类效果.
机构地区 哈尔滨工业大学
出处 《情报学报》 CSSCI 北大核心 2003年第4期451-456,共6页 Journal of the China Society for Scientific and Technical Information
  • 相关文献

参考文献4

  • 1邹涛,王继成,张福炎.基于WWW的资料搜集系统的设计与实现[J].情报学报,1999,18(3):195-201. 被引量:32
  • 2Dasigi, Venu, Mann, Reinhold C. , Protopopescu, Vladimir A..Information fusion fox text classification--an experimental comparison. Pattern Recognition. 2001,34 (12) : 2413 - 2425.
  • 3Tan, Chade-Meng, Wang, Yuan-Fang, Lee, Chan-Do. The use of bigrams to enhance text categorization. Information Processing and Management, 2002,38 (4) : 529 - 546.
  • 4Fuketa, Masao, Lee, Sangkon, Tsuji, Takako, Okada, Makoto,Aoe,Jun-ichi. A document classification method by using field association words. Information Sciences, 2000,126 (1-4) : 57 - 70.

二级参考文献2

  • 1吴立德,大规模中文文本处理,1997年
  • 2G Salton,Commun ACM,1975年,1卷,18期,613页

共引文献31

同被引文献50

引证文献6

二级引证文献25

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部