数据挖掘中关联弱化问题的解决方法分析被引量：3

Research on Solution to Association Weakening Problem in Data Mining

下载PDF

导出

摘要当前的支持向量机和均值聚类等数据挖掘算法中,几乎都是依靠数据之间的关联性来完成数据匹配。一旦数据库中含有大量的冗余数据,将造成数据之间的相关性降低,关联性被破坏,导致传统的数据挖掘算法效率降低。为了避免上述缺陷,提出了一种弱化关联规则修补挖掘算法。利用弱聚类方法,在数据选择过程中,不将所有的元素都进行初始分类处理,只计算某一元素属于某一个类别的概率,确定多个弱聚类中心,计算不同数据之间的弱聚类关联性,从而实现关联规则较弱的冗余环境下准确的数据挖掘。实验结果表明,这种算法能够有效提高海量冗余环境下的数据挖掘效率,取得了令人满意的效果。 The support vector machine （SVM） and mean cluster data mining algorithm, almost all rely on the correla- tion between data, complete data matching. Once the database contains a large amount of redundancy data, the correla- tion between data will be reduced, and relevance is destroyed, resulting in traditional data mining algorithm efficiency lower. In order to avoid the above defects, this paper proposed a weakening association rules repair mining algorithm. In the data selection process, the method will not make initial classification processing for all elements only calculates proba- bility that one element belongs to a category, and determines multiple weak clustering center, calculates weak clustering relevance between different data, so as to realize the association rules weaker redundancy environment accurate data mining. The experimental results show that this algorithm can effectively improve the massive redundant environment data mining efficiency, has made the satisfactory effect.

作者杨泽民郭显娥王文军

机构地区山西大同大学数学与计算机科学学院

出处《计算机科学》 CSCD 北大核心 2013年第8期220-222,共3页 Computer Science

基金国家自然科学基金(11171112)资助

关键词海量冗余数据挖掘关联规则 Mass redundancy Data mining Association rules

分类号 F127 [经济管理—世界经济]

引文网络
相关文献

参考文献8

1崔建,李强,杨龙坡.基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法[J].计算机科学,2011,38(4):216-220. 被引量：24
2Tojanovic Z, Dahanayake A. Service-Oriented Software System Engineering Challenges and Practices [J]. Idea Group Publi- shing,2011 ： 1-47.
3Tasi T,Zhang D,Chen Y,et al. A software reliability model for Web services [C]// 8th IASTED International Conference on Software Engineering and Applications. Cambridge, MA, USA, 2011:144-149.
4穆肇南,张健.数据挖掘技术在经济预测中的应用[J].计算机仿真,2012,29(6):347-350. 被引量：10
5王晟,赵壁芳.基于模糊数据挖掘和遗传算法的网络入侵检测技术[J].计算机测量与控制,2012,20(3):660-663. 被引量：28
6Xu Yue, Li Yue-feng. Mining non-redundant association rules based on concise bases[J]. International Journal of Pattern Re- cognition and Artificial Intelligence, 2007,21(4) : 659-675.
7Loglisci C, Malerba D. Mining multiple level non-redundant as- sociation rules through two-fold pruning of redundancies[C]// Proceedings of MLDM. 2009 : 251-265.
8Cheng J, ke Y P, Ng W. Effective elimination of redundant asso- ciation rules[J]. Data mining and knowledge discovery, 2008,16 (2) : 221-249.

二级参考文献32

1陈飞,高铁梅.结构时间序列模型在经济预测方面的应用研究[J].数量经济技术经济研究,2005,22(2):95-103. 被引量：29
2陈德军,张玉民,陈绵云.系统云灰色宏观调控预测模型及其应用研究[J].控制与决策,2005,20(5):553-556. 被引量：4
3丁艳辉,王洪国,高明,谷建军.一种基于矩阵的关联规则挖掘新算法[J].计算机科学,2006,33(4):188-189. 被引量：13
4肖健华,林健,刘晋.区域经济中长期预测的支持向量回归方法[J].系统工程理论与实践,2006,26(4):97-103. 被引量：19
5Agrawa R, Imielinski T, Swami A. Mining association rules between sets of items in large databases[C].//Proc, of ACM SIGMOD International Conference on Management of Date. Washington DC,1993 : 207-216.
6Park J S, Ming-Syan C, Philip S Y. An Effective Hash Based Algorithm for Mining Association Rules[C].// Proc of ACMSIGMOD. 1995 : 175-185.
7Brin S, Motwai R, Ullman J D, et al. Dynamic Itemset Counting and Implication Rules for Market BasketData [C].//Proc. of ACM SIGMOD Conference on Management of Data. 1997:265-276.
8Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules in Large Databaes[C].//Proc. of 1994 International Conference on Very Large Databases. 1994:487-499.
9Savasere S, Omiecinski E, Navathe S. An Efficient Algorithm for Mining Association Rules in Large Databases[C].//Proc. of 21^St VLDB. 1995 : 432-444.
10Dunkel B, Soparkar N. Data Organization and Access for Efficient Data Mining[C].//Proc. of 15th IEEE Intl. Conf. on Data Engineering. 1999 : 522-529.

共引文献57

1牛新征,佘堃.面向大规模数据的快速并行聚类划分算法研究[J].计算机科学,2012,39(1):134-137. 被引量：22
2王飞,缑锦.基于多变异粒子群优化算法的模糊关联规则挖掘[J].计算机科学,2013,40(5):217-223. 被引量：12
3刘昆,李红林,李颖芳.基于时序数据的学生分层算法研究[J].中国科技信息,2013(9):80-80.
4刘昆.基于BP神经网络的学生分层算法研究[J].科技信息,2013(15):13-13.
5杨悦,杨永安,胡绍林.逐段回归近似的卫星遥测数据挖掘算法与仿真[J].计算机仿真,2013,30(8):109-112. 被引量：7
6王锋,孙翠华.汽车发动机故障征兆挖掘技术的研究与仿真[J].计算机仿真,2013,30(10):229-232. 被引量：4
7彭学军.遗传算法在网络入侵检测系统中的应用[J].计算机光盘软件与应用,2013,16(24):172-172. 被引量：1
8唐洪涛.数据中心特征失真下的深度挖掘算法研究[J].科技通报,2013,29(12):45-47. 被引量：1
9马琰,闫兵.基于混沌差分优化算法的网络入侵检测系统[J].科学技术与工程,2013,21(36):10967-10970. 被引量：2
10林长方,吴扬扬.关联规则挖掘技术在冠心病诊断中的应用[J].江南大学学报（自然科学版）,2014,13(1):60-66. 被引量：3

同被引文献15

1黄晓斌,赵超.文本挖掘在网络舆情信息分析中的应用[J].情报科学,2009,27(1):94-99. 被引量：119
2刘佐达,张久岭,陈茂科,李星.一种面向BBS信息检索的主题网络爬虫算法[J].郑州大学学报（理学版）,2010,42(2):22-25. 被引量：13
3徐子豪,张腾飞.基于语音识别和无线传感网络的智能家居系统设计[J].计算机测量与控制,2012,20(1):180-182. 被引量：67
4张超,魏三强,朱军.一种农业信息数据挖掘系统的研究与应用[J].苏州科技学院学报（自然科学版）,2013,30(1):75-80. 被引量：5
5王飞,缑锦.基于多变异粒子群优化算法的模糊关联规则挖掘[J].计算机科学,2013,40(5):217-223. 被引量：12
6韦相.基于模糊聚类的Web用户访问序列挖掘[J].西安文理学院学报（自然科学版）,2013,16(3):53-56. 被引量：2
7刘威,路来君,王洪肖,曹延波.基于G^4 ICCS系统的数据挖掘并行算法[J].吉林大学学报（信息科学版）,2013,31(3):324-327. 被引量：3
8王功聪,王景中,王宝成.基于数据包内容的网络异常行为分析方法研究[J].信息网络安全,2013(12):58-61. 被引量：7
9张国兵,郎荣玲,周凯.基于模糊核聚类的支持向量分类[J].计算机应用,2013,33(A02):108-110. 被引量：3
10卢东升.基于模糊论和数据挖掘网络学习过程评价研究[J].无线互联科技,2013,10(12):22-22. 被引量：1

引证文献3

1耿向华,潘宁.引入或然状态优化控制的网络文本特征挖掘[J].科技通报,2014,30(6):61-63. 被引量：1
2王乐,王芳.数据库异常数据的检测仿真研究[J].计算机仿真,2016,33(1):430-433. 被引量：10
3潘燕.关联规则下的数据挖掘算法分析[J].信息记录材料,2018,19(7):212-213. 被引量：7

二级引证文献18

1匡容,杨振国,刘文印.基于多重因素的个性化学习推荐系统[J].计算机应用研究,2020,37(1):183-187. 被引量：7
2朱贺军,马丁.海量短文本实时挖掘方法的研究与仿真[J].计算机仿真,2015,32(12):442-446. 被引量：4
3张清川,孙帆,王宇晨,李金良,王洁.物联网环境下Web数据库异常数据检测方法研究[J].计算机测量与控制,2017,25(9):170-173. 被引量：3
4袁红春,吕苏娜.水产养殖水质异常优化预测仿真研究[J].计算机仿真,2017,34(12):447-450. 被引量：4
5马强.Web网络下的异常路由数据监测技术研究[J].现代电子技术,2018,41(2):18-20. 被引量：1
6李小玲.关于网络数据库传输中异常数据检测仿真研究[J].计算机仿真,2018,35(1):420-423. 被引量：7
7王丹,李娜.无线网络恶意入侵数据自动识别仿真研究[J].计算机仿真,2018,35(6):333-336. 被引量：2
8向春梅,陈超.基于树堆的频繁项集挖掘算法[J].电脑知识与技术,2019,15(1X):26-28.
9农晓锋.高维数据集中局部离散文本数据挖掘方法研究[J].现代电子技术,2017,40(19):138-141. 被引量：3
10陈星灿,徐冰.KNN数据挖掘算法在霾等级预报中的应用[J].电脑知识与技术,2019,15(3X):3-4.

1刘凯,国伟,毕研博.浅析关联规则及其数据挖掘算法[J].中国科技博览,2015,0(7):306-306.
2金碚.科学发展观与经济增长方式转变[J].学术动态（北京),2006(18):2-15. 被引量：1
3柳德舫.化危为机促科学发展真抓实干谱茂名新篇[J].南方论刊,2009(4):16-18.
4毕崇武.关联规则视角下的微博营销策略[J].科技创业月刊,2015,28(2):35-38. 被引量：1
5刘学洪.基于马尔科夫挖掘算法的突发事件决策方法[J].计算机仿真,2012,29(12):262-265. 被引量：2
6华民.中国宏观调控为何未能取得令人满意的效果?[J].沪港经济,2008(5):19-19.
7赵萌.基于关联规则的唐山市城市居民生态消费行为个体[J].经济视野,2014,0(12):16-16.
8池涛.油井工艺措施设计中关联规则数据挖掘的应用[J].数字石油和化工,2009(1):34-38.
9刘四辈,陈刚.把握好“效率优先兼顾公平”的度[J].企业文明,1995(9):35-36.
10一言.统一核算GDP 结束不同数据局面[J].中国经济信息,2007(3):38-38.

计算机科学

2013年第8期

浏览历史

内容加载中请稍等...

数据挖掘中关联弱化问题的解决方法分析被引量：3

参考文献8

二级参考文献32

共引文献57

同被引文献15

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

数据挖掘中关联弱化问题的解决方法分析 被引量：3

参考文献8

二级参考文献32

共引文献57

同被引文献15

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

数据挖掘中关联弱化问题的解决方法分析被引量：3