期刊文献+

浅谈基于粗集理论的文本归类系统

Study on text categorization system based on rough set theory
在线阅读 下载PDF
导出
摘要 文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。 Text categorization is an important automatic classification technology in dealing with large amounts of text data. We established text categorization system based on the rough sets theory. On the basis of the known categories training sets, we analyzed samples of the training data, found a decision table to get the discernibility matrix and built the discernibility functions, then simplified the discernibility functions to get the min-attribute simplification. At last, we used Apriori algorithm to generate the final classification rule table, which is available for automatic text data categorization.
作者 孟坛 张蓉
出处 《河北工业科技》 CAS 2010年第6期414-416,共3页 Hebei Journal of Industrial Science and Technology
关键词 粗集 林业文本信息分类 APRIORI算法 rough sets text categorization Apriori algorithm
  • 相关文献

参考文献4

二级参考文献9

共引文献26

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部