期刊文献+

基于聚类的文本过滤模型 被引量:9

Text filtering model based on clustering analysis
在线阅读 下载PDF
导出
摘要 为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一类由表达相同或相近兴趣的用户模板组成 .匹配时 ,先将文本推送到相应的模板类中 ,再计算与具体模板的相似度 ,获得最终的匹配结果 。 The paper presents the text filtering model based on clustering in order to help users search the texts related to their interests on the internet. Its main idea is shown as follows: Under the hierarchical categories pre\|arranged by the model, it applied the query expansion approach to the user profiles based on the co\|occurrence matrix, and then it divided the expanded user profiles into several classes by clustering analysis. In the course of matching texts and user profiles, it first pushes the texts to the relevant profile classes, and it ranks the texts according to the similarities between texts and user profiles. The experiments show that it remarkably improves the efficiency of the text filtering.
出处 《大连理工大学学报》 CAS CSCD 北大核心 2002年第2期249-252,共4页 Journal of Dalian University of Technology
关键词 语言处理 聚类分析 文本过滤模型 用户模板 查询扩张 模板扩张 speech processing clustering analysis/text filtering user profile query expansion
  • 相关文献

参考文献2

二级参考文献11

  • 1吴立德,大规模中文文本处理,1997年
  • 2Yan T W,Proc of the 1995 USENIX Technical Conf,1995年
  • 3姚天顺,自然语言理解,1995年
  • 4Yan T W,Proc of the Third Intl Conf on Parallel and Distributed Information System,1994年,89页
  • 5Eichstaedt M,6th International Workshop on Solving Irregularly Structured Problems in Paralle,1998年,17页
  • 6程学旗,中文信息处理国际会议论文集,1998年,418页
  • 7Lu Qi,Computer Networks ISDN Systems,1997年,30卷,7期,443页
  • 8姚天顺,自然语言理解,1995年
  • 9Yan T W,Proc of 3 rd International Conference on Parallel andDistributed Information Sys,1994年,89页
  • 10Yan T W,Proc of 1995 U SENIX Technical Conf.Http://www-db.standford.edu/pub/yan

共引文献17

同被引文献96

引证文献9

二级引证文献131

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部