期刊文献+

铁路运输信息数据分类算法的研究与实现

Study and realization of TMIS data automatic classification arithmetic
在线阅读 下载PDF
导出
摘要 介绍两种基于统计的自动分类技术(朴素贝叶斯分类器、支持向量机分类器),剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出。针对此局限性,为了提高自动分类的精度,我们引入了基于规则的自动分类来对其进行改进和扩充,并整合两种自动分类技术的优点,设计出了混合分类器系统,应用于铁路运输信息系统,进行分类分析,从而获得了比较理想的分类效果。 The technique of data automatic classification is to classify data into one or more classes according to certain strategy.This paper firstly reports two kinds of technique of data automatic category based on statistics(austerity Bayes classifier and supporting vector machine classifier),and analyses their advantages and disadvantages. The weakness of statistics-based automatic category is that the category precision decreases while the character intersection within classes increases, especially in the case of multi-layers classifying. In order to improve automatic category performance, rule-based automatic category is used.Combining statistics-based category with rule-based classifying method, this paper designs and realizes a system of mixing category lastly applied to TMIS, which has very good performance in category.
出处 《信息技术》 2005年第7期70-73,共4页 Information Technology
关键词 信息处理 数据挖掘 数据分类 规则分类 information processing data mining data classification rule-based classifying
  • 相关文献

参考文献5

  • 1[美]Mehmed Kantardzic,闪四清,陈茵,程雁.数据挖掘-概念、模型、方法和算法[M].清华大学出版社,2003.
  • 2[加]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,等译.机械工业出版社,2003.
  • 3DavidHand HeikkiMarmila PadhraicSmyth 张银奎 廖丽 宋俊译.数据挖掘原理[M].机械工业出版社,2003..
  • 4[美]OliviaParrRud 朱杨勇 左子叶 张忠平译.数据挖掘实践[M].机械工业出版社,2003..
  • 5林杰斌.数据挖掘与OLAP理论与务实[M].北京:清华大学出版社,2003..

共引文献36

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部