铁路运输信息数据分类算法的研究与实现

Study and realization of TMIS data automatic classification arithmetic

下载PDF

导出

摘要介绍两种基于统计的自动分类技术(朴素贝叶斯分类器、支持向量机分类器),剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出。针对此局限性,为了提高自动分类的精度,我们引入了基于规则的自动分类来对其进行改进和扩充,并整合两种自动分类技术的优点,设计出了混合分类器系统,应用于铁路运输信息系统,进行分类分析,从而获得了比较理想的分类效果。 The technique of data automatic classification is to classify data into one or more classes according to certain strategy.This paper firstly reports two kinds of technique of data automatic category based on statistics(austerity Bayes classifier and supporting vector machine classifier),and analyses their advantages and disadvantages. The weakness of statistics-based automatic category is that the category precision decreases while the character intersection within classes increases, especially in the case of multi-layers classifying. In order to improve automatic category performance, rule-based automatic category is used.Combining statistics-based category with rule-based classifying method, this paper designs and realizes a system of mixing category lastly applied to TMIS, which has very good performance in category.

作者张垒磊刘胜辉

机构地区哈尔滨铁路局信息技术中心哈尔滨理工大学

出处《信息技术》 2005年第7期70-73,共4页 Information Technology

关键词信息处理数据挖掘数据分类规则分类 information processing data mining data classification rule-based classifying

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1[美]Mehmed Kantardzic,闪四清,陈茵,程雁.数据挖掘-概念、模型、方法和算法[M].清华大学出版社,2003.
2[加]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,等译.机械工业出版社,2003.
3DavidHand HeikkiMarmila PadhraicSmyth 张银奎廖丽宋俊译.数据挖掘原理[M].机械工业出版社,2003..
4[美]OliviaParrRud 朱杨勇左子叶张忠平译.数据挖掘实践[M].机械工业出版社,2003..
5林杰斌.数据挖掘与OLAP理论与务实[M].北京:清华大学出版社,2003..

共引文献36

1潘无名,潘云鹤.数据挖掘过程的多维视图[J].计算机应用研究,2004,21(8):211-213. 被引量：4
2吴新玲.基于贝叶斯方法的分类预测[J].计算机工程与应用,2004,40(33):195-197. 被引量：2
3严华云.Web挖掘在网络教育中的应用研究[J].湖州师范学院学报,2003,25(6):72-75. 被引量：10
4邱长波,李瑞录,黄薇.人口信息系统数据挖掘的数据预处理研究[J].情报科学,2004,22(12):1487-1489. 被引量：3
5杨卫民,谭骏珊,汪斌.数据仓库和数据挖掘技术在DSS中的应用研究[J].计算机工程与设计,2004,25(10):1695-1697. 被引量：17
6黄育芹.判定树归纳分类法在数据挖掘中的应用[J].湛江海洋大学学报,2004,24(6):45-49. 被引量：1
7胡洪宁,郭福亮.一种基于OLAP与DM的OLAM模型的研究[J].计算机与数字工程,2005,33(3):39-41. 被引量：4
8李英梅,臧宏.面向Web的数据挖掘技术[J].农机化研究,2005,27(3):260-261. 被引量：1
9朱晓东,李帮义.基于支持度变化的关联规则重挖掘技术[J].机械制造与自动化,2005,34(2):75-77. 被引量：1
10李斗,李弼程.一种神经网络文本分类器的设计与实现[J].计算机工程与应用,2005,41(17):107-109. 被引量：2

1李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用[J].中文信息学报,2004,18(4):9-14. 被引量：20
2恽俊,唐屹.Snort系统的动态配置研究[J].广州大学学报（自然科学版）,2007,6(1):20-24. 被引量：3
3王志刚,李宗福.决策树技术在基于Web入侵检测技术中的应用研究[J].计算机光盘软件与应用,2010(1):23-25.
4武建华,沈均毅,王元元.一种改进的关联分类算法[J].计算机工程,2009,35(9):63-65. 被引量：6
5王宁.网络技术在铁路运输信息管理现代化建设中的应用[J].铁道勘测与设计,1998(2):100-102.
6程柏良,周洪波,钟林辉.基于异常与误用的入侵检测系统[J].计算机工程与设计,2007,28(14):3341-3343. 被引量：11
7朱红斌,蔡郁.基于支持向量机的多层分类入侵检测系统研究[J].丽水学院学报,2008,30(2):54-57.
8查金水,宋良图,刘现平.一种基于关联规则分类的改进方法[J].计算机工程与应用,2006,42(10):155-157.
9王直杰,方建安,邵世煌.分类器系统综述[J].中国纺织大学学报,1997,23(1):97-104.
10杨霞,董红斌,张海玉,.基于分布估计算法的朴素贝叶斯分类问题研究[J].电脑知识与技术（过刊）,2010,0(13):2704-2705. 被引量：2

信息技术

2005年第7期

浏览历史

内容加载中请稍等...

铁路运输信息数据分类算法的研究与实现

参考文献5

共引文献36

相关作者

相关机构

相关主题

浏览历史