基于Naive Bayes的CLIF_NB文本分类学习方法被引量：1

Method of CLIF_NB Text Classification Learning Based on Naive Bayes

下载PDF

导出

摘要针对NaiveBayes方法中条件独立性假设常常与实际相违背的情况,提出了CLIF-NB文本分类学习方法,利用互信息理论,计算特征属性之间的最大相关性概率,用变量集组合替代线性不可分属性,改善条件独立性假设的限制,并通过学习一系列分类器,缩小训练集中的分类错误,综合得出分类准确率较高的CLIF-NB分类器. The method of CLIF_NB text classification learning based on Naive Bayes is proposed. To solve the problem that independence hypothesis is not coincident with the actual situation in Naive Bayes classification method, the paper uses the theory of mutual information, and calculate the maximum relative probability during training the text feature properties, and import variables set to combine and replace line inseparable attributes. So the method can improve the limit of conditional independence hypothesis, and also decrease the classification errors in training dataset by learning from a series of classifiers, high accuracy CLIF_NB classifying model can be gained.

作者刘丽珍宋瀚涛陆玉昌

机构地区首都师范大学信息工程学院北京理工大学计算机系清华大学计算机系

出处《小型微型计算机系统》 CSCD 北大核心 2005年第9期1575-1577,共3页 Journal of Chinese Computer Systems

基金国家"九七三"重点基础研究项目(G1998030414)资助

关键词文本分类 NAIVE BAYES 条件独立性假设 text classification Naive Bayes conditional independence hypothesis

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Joseph Giarratano, Gary Riley. Principle and programming of expert system[M]. Beijing :Machine Industry Press, 2000,5.
2Marco A Wiering . Hierarchical mixtures of Naive bayes classifiers[R]. Intelligent Systems Group Utrecht University, TR,2002.
3Chen Yun, Zhou Liang. The theory of information and coding[M]. Beijing:Electron Industry Press, 2002.
4Jie Cheng, Russell Greiner. Learning bayesian belief network classifiers: algorithms and system[J]. Lecture Notes in Computer Science, 2001,189-126.
5Liu Li-zhen, Chen Jun-jie,Song han-tao. The research of web mining[C]. Proceeding of the 4^th World Congress on Intelligent Control and Automation,2003, 2333-2337.

同被引文献18

1蒋国瑞,司学峰.基于代价敏感SVM的电信客户流失预测研究[J].计算机应用研究,2009,26(2):521-523. 被引量：22
2关健,刘大昕.一种基于多层感知机的无监督异常检测方法[J].哈尔滨工程大学学报,2004,25(4):495-498. 被引量：4
3钱苏丽,何建敏,王纯麟.基于改进支持向量机的电信客户流失预测模型[J].管理科学,2007,20(1):54-58. 被引量：27
4ROIGER R J.GEATZ M W.数据挖掘教程[M].翁敬农,译.北京:清华大学出版社,2003:36-37.
5XIE Y Y, LI X, NGAI E W T, et al. Customer Churn Prediction Using Improved Balanced Random Forests[J]. Expert Systems with Applications,2009, 36(3) :5 445-5 449.
6KEAVENEY S M. Customer Switching Behavior in Service Industries: An Exploratory Study[J]. Journal of Marketing, 1995, 59(2): 71-82.
7MOZER M C, WOLNIEWlCZ R. Predicting Subscriber Dissatisfaction and Improving Retention in the Wireless Telecommunications Industry [J]. Neural Networks IEEE Transactions, 2000,11 (3) : 690 - 696.
8BREIMAN L, FRIEDMAN J H, OLSEN R A, et al. Classification and Regression Trees[M]. Bel- mont: Wadsworth International Group, 1984.
9DOMINGOS P. MetaCost: A General Method for Making Classifiers Cost-Sensitive[C]//Proeeedings of the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Die- go, CA, 1999: 155-164.
10TING K M. An Instance Weighting Method to In- duce Cost-Sensitive Trees[J]. IEEE Transactions on Knowledge and Data Engineering, 2002, 14 (3) : 659-665.

引证文献1

1罗彬,邵培基,夏国恩.基于多分类器动态选择与成本敏感优化集成的电信客户流失预测研究[J].管理学报,2012,9(9):1373-1381. 被引量：12

二级引证文献12

1邱一卉,林成德.基于随机森林和单类支持向量机的电信行业客户流失预测[J].厦门大学学报（自然科学版）,2013,52(5):603-608. 被引量：4
2徐孝娟,赵宇翔,朱庆华,孙霄凌.社交网站中用户流失要素的理论探讨及实证分析[J].信息系统学报,2014,8(1):83-97. 被引量：10
3邱一卉.基于剪枝随机森林的电信行业客户流失预测[J].厦门大学学报（自然科学版）,2014,53(6):817-823. 被引量：7
4黄忠,胡敏,刘娟.基于多特征决策级融合的表情识别方法[J].计算机工程,2015,41(10):171-176. 被引量：3
5夏国恩.基于满意控制的客户流失两类错误[J].系统工程,2016,34(3):136-141. 被引量：4
6王建仁,李妮,段刚龙.基于信息融合的电信客户流失预测研究[J].计算机工程与应用,2016,52(10):64-70. 被引量：8
7王锐,王虎,李冰.粗糙集理论在客户群标准客户塑造中的应用研究[J].江西理工大学学报,2017,38(2):46-51. 被引量：2
8徐孝娟,赵宇翔,吴曼丽,朱庆华,邵艳丽.S-O-R理论视角下的社交网站用户流失行为实证研究[J].情报杂志,2017,36(7):188-194. 被引量：56
9梁修荣,杨正益.基于聚类和SVM的数据分类方法与实验研究[J].西南师范大学学报（自然科学版）,2018,43(3):91-96. 被引量：8
10马文斌,夏国恩.基于深度神经网络的客户流失预测模型[J].计算机技术与发展,2019,29(9):76-80. 被引量：14

1邓桂骞,赵跃龙,刘霖,王元华.一种优化的贝叶斯分类算法[J].计算机测量与控制,2012,20(1):199-201. 被引量：14
2杨忠强,秦亮曦.一种基于属性加权的朴素贝叶斯改进算法[J].广西大学学报（自然科学版）,2013,38(5):1157-1161. 被引量：2
3张春,郭明亮.大数据环境下朴素贝叶斯分类算法的改进与实现[J].北京交通大学学报,2015,39(2):35-41. 被引量：13
4杨忠强,秦亮曦.一种基于维规约的属性加权朴素贝叶斯算法[J].信息技术,2013,37(12):31-33.
5奇妙的Shift键[J].计算机与网络,2002,28(1):30-30.
6曾文赋.样本-属性加权的朴素贝叶斯改进算法[J].微型机与应用,2014,33(6):62-63.
7黄宇达,王迤冉.基于朴素贝叶斯与ID3算法的决策树分类[J].计算机工程,2012,38(14):41-43. 被引量：20
8杨岳湘,田艳芳,王韶红.基于模糊聚类和Naive Bayes方法的文本分类器[J].计算机工程与科学,2002,24(5):18-21. 被引量：1
9王峻.一种基于强属性限定的贝叶斯分类模型[J].计算机技术与发展,2007,17(2):205-207. 被引量：1
10俞杰,丁晓剑,崔鹏.关联规则挖掘以改进朴素贝叶斯[J].舰船电子工程,2016,36(5):112-117. 被引量：1

小型微型计算机系统

2005年第9期

浏览历史

内容加载中请稍等...

基于Naive Bayes的CLIF_NB文本分类学习方法被引量：1

参考文献5

同被引文献18

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于Naive Bayes的CLIF_NB文本分类学习方法 被引量：1

参考文献5

同被引文献18

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于Naive Bayes的CLIF_NB文本分类学习方法被引量：1