-
题名基于概念获取的多文档主题划分研究
被引量:6
- 1
-
-
作者
孔庆苹
刘宗田
廖涛
-
机构
上海大学计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2008年第5期131-133,共3页
-
基金
国家发改委项目基金(SNMCFIP-2006S001)资助
-
文摘
对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值。当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果。本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题。实验结果表明该方法对多个相关文档的主题划分取得了良好的效果。
-
关键词
信息处理
知网
概念
主题聚类
主题划分
-
Keywords
information processing, hownet,concept,document clustering,topic partition
-
分类号
TP317.2
[自动化与计算机技术—计算机软件与理论]
G633.34
[文化科学—教育学]
-