一种测试数据挖掘算法的数据源生成方法被引量：16

A METHOD OF DATA SOURCE GENERATION FOR TESTING DATA MINING ALGORITHMS

下载PDF

导出

摘要随着数字时代的来临 ,数据挖掘成为知识领域中的研究热点 .但由于保密、数据多样性等问题 ,测试数据源的获取一直困扰着数据挖掘算法的研究 .为此 ,提出一种基于云模型的测试数据源生成方法 ,利用此方法 ,给出了数量型数据的生成算法 ,对范畴型数据的生成进行了讨论 .由于云模型中随机性与模糊性的特点 ,各属性的数据之间除了包含已知的先验知识以外 ,数据的分布、各属性之间的关系也会存在一定的随机和模糊 ,使得构造的数据源中又隐含了许多潜在知识 .利用此方法 ,研究人员可根据自己的实际情况进行不同类型、不同量级数据源的构造。 Because of the problem of secrecy, diversity of data and so on, data resources for testing data mining algorithms always persecute the research of data mining. Therefore, a method of data source generation based on a cloud model is presented in this paper. The generation algorithm for quantitative data is given and the generation of categorical data is also discussed. Because of the randomness and fuzziness in the cloud model, the generated data contain potential knowledge except known knowledge, and the data distribution and relationship between attributes also have random and fuzzy facts. Researchers can use this model to generate diverse type and diverse quantitative data they want and then test the data mining algorithms.

作者杜鷁李德毅

机构地区中国人民解放军理工大学中国电子系统工程研究所

出处《计算机研究与发展》 EI CSCD 北大核心 2000年第7期776-782,共7页 Journal of Computer Research and Development

基金国家"八六三"高技术研究发展计划基金项目资助!(项目编号 3 0 6-ZT0 6-0 7-2)

关键词数据挖掘云模型数据源生式数据库算法测试 data mining, cloud model, cloud generator

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量：1340
2Das G，Proc of the4th Int’ l Conf on Knowledge Discovery and Data Mining（ KDD-98），1998年，16页
3Cheung D W L，Proc of the 12 th Int’ l Conf on Data Engineering，1996年，106页

二级参考文献5

1李德毅.发现状态空间理论[J].小型微型计算机系统,1994,15(11):1-6. 被引量：25
2李德毅，计算机智能接口与智能应用论文集，1993年
3吴国富，实用数据分析方法，1992年
4李中夫，模糊系统与数学，1987年，1卷，1期，1页
5李德毅

共引文献1339

1田红娜,孙钦琦.基于云模型的汽车制造企业绿色技术创新能力评价研究[J].管理评论,2020,0(2):102-114. 被引量：39
2周雪,左忠义,程伟.基于组合赋权云模型的铁路旅客运输安全评价[J].中国安全科学学报,2020(S01):158-164. 被引量：35
3何佳蔓.基于云模型的区间直觉模糊数多属性群决策[J].计算机系统应用,2022,31(12):405-411. 被引量：4
4刘英杰,许亚辉,李光辉.基于云-TOPSIS法的全过程工程咨询方案优选[J].项目管理技术,2022,20(4):89-94.
5周勇,刘博,傅鹤林,景志泉,曹桂乾.基于云理论的软弱富水破碎围岩特长隧道施工风险评估[J].现代隧道技术,2024,61(S01):99-108. 被引量：3
6高闻,杨国华.安全监测数据分析软件开发中的若干技术问题[J].水利水电技术（中英文）,2022,53(S01):123-132. 被引量：3
7高崧韬,刘峻宏,宫梦莹.大数据环境下多元主体协同的网络舆情治理能力研究[J].情报科学,2023,41(12):41-47. 被引量：7
8任海芝,杨子慧.基于正态云模型的审计重大错报风险评价研究[J].辽宁工程技术大学学报（社会科学版）,2021,23(4):280-289. 被引量：2
9于颖,陈岩.基于单值中智语言信息的扩展AQM云模型群决策[J].模糊系统与数学,2023,37(5):143-152.
10杜文胜,吴映雪.基于文献计量学的国内模糊集研究现状分析[J].模糊系统与数学,2023,37(2):122-133.

同被引文献208

1蒋嵘,李德毅,陈晖.基于云模型的时间序列预测[J].解放军理工大学学报（自然科学版）,2000,1(5):13-18. 被引量：37
2田永青,杜国宁,李志,朱仲英.基于云理论神经网络决策树的生成算法[J].上海交通大学学报,2003,37(z1):113-117. 被引量：11
3李涛,孙衢,杨莉,徐婷婷.基于解耦矢量云模型的智能控制器设计[J].四川大学学报（工程科学版）,2009,41(5):232-237. 被引量：4
4王威,马东辉,苏经宇,韩阳,任磊,黎江林.基于二维多规则云模型定性推理的场地分类方法[J].北京工业大学学报,2009,35(10):1364-1372. 被引量：13
5李众,高键.电液伺服变距系统的二维云模型控制研究[J].系统仿真学报,2004,16(5):1050-1052. 被引量：20
6李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：939
7李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：418
8刘常昱,冯芒,戴晓军,李德毅.基于云X信息的逆向云新算法[J].系统仿真学报,2004,16(11):2417-2420. 被引量：197
9段海滨,王道波,于秀芬,朱家强.基于云模型理论的蚁群算法改进研究[J].哈尔滨工业大学学报,2005,37(1):115-119. 被引量：44
10张国英,沙云,刘旭红,刘玉树.高维云模型及其在多属性评价中的应用[J].北京理工大学学报,2004,24(12):1065-1069. 被引量：27

引证文献16

1张树瑜,朱仲英.基于Web的自映射空间决策树方法研究[J].计算机工程与应用,2005,41(3):184-187. 被引量：1
2纪元,陈未如,张雪.并发关系模式合成数据源生成方法[J].山东大学学报（理学版）,2007,42(9):84-87. 被引量：2
3魏伟杰,张斌,王波,张明卫.一种用于数据挖掘算法的数据生成方法[J].东北大学学报（自然科学版）,2008,29(3):328-331. 被引量：7
4陈贵林.一种定性定量信息转换的不确定性模型——云模型[J].计算机应用研究,2010,27(6):2006-2010. 被引量：57
5夏建明,杨俊安,张琼.基于数据符号化表示和云模型的时序数据生成方法[J].计算机应用研究,2010,27(10):3691-3693. 被引量：2
6付斌,李道国,王慕快.云模型研究的回顾与展望[J].计算机应用研究,2011,28(2):420-426. 被引量：122
7尹华,董红斌.基于人工数据产生器的噪声检测评价框架[J].武汉大学学报（工学版）,2011,44(5):676-680.
8林培光,汤世平,余正涛.基于云理论的数据属性约简[J].计算机应用,2006,26(S2):154-155. 被引量：2
9王金芝,王国胤,许昌林.一种新的云综合方法在彩色图像分割中的应用[J].智能系统学报,2013,8(6):517-525. 被引量：4
10张伟,平殿发,张韫.云推理在雷达干扰效果评估中的应用[J].雷达科学与技术,2014,12(6):569-573. 被引量：1

二级引证文献335

1罗丹.一种基于多维高斯云模型的过采样方法[J].周口师范学院学报,2020(2):104-107. 被引量：1
2易恒如,曾庆蓉.基于熵权和云模型的长江干线航道通航风险评价研究[J].中国水运,2022(S01):24-29. 被引量：1
3杨小军,徐忠富,贺正求,赵洋.基于犹豫云语言术语集的多指标群决策方法[J].计算机应用研究,2020,37(S01):55-57. 被引量：2
4杨承志,吴宏超,栗苹,王美玲.基于云模型和支持向量机的辐射源识别算法[J].现代雷达,2013,35(10):41-44. 被引量：2
5赵嵩正,殷茗,梁工谦,刘暐.基于.NET的特大型航空产品质量评估系统的设计与实现[J].计算机应用,2005,25(9):2155-2158. 被引量：3
6谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量：134
7赵军,张显跃.基于粗集理论的数据离散化技术研究[J].重庆邮电学院学报（自然科学版）,2006,18(6):752-757. 被引量：14
8张家精,王焕宝,陈金兰,倪友聪.基于云模型的隶属概念判定算法的改进[J].计算机技术与发展,2007,17(10):65-68. 被引量：6
9陈果.基于遗传算法的决策表连续属性离散化方法[J].仪器仪表学报,2007,28(9):1700-1705. 被引量：9
10文振华,左洪福.基于粗糙集-集成神经网络的航空发动机磨损故障诊断方法[J].中国机械工程,2007,18(21):2580-2584. 被引量：10

1谢亚力,尹怡欣,杜军平.旅游信息数据挖掘中数量型数据的转化和分析研究[J].微计算机信息,2006,22(07X):189-191. 被引量：1
2王婷婷.关联规则在教学评价中的应用[J].中国科教创新导刊,2008(23):44-44. 被引量：2
3王朝辉,王婷婷.教学评价信息数据挖掘中数据的转化和分析研究[J].贵州工业大学学报（自然科学版）,2007,36(4):40-42. 被引量：4
4赵磊.一种基于模糊等价矩阵传递闭包的聚类算法[J].电脑知识与技术（过刊）,2010,16(9X):7343-7345. 被引量：2
5王宗江.利用梯形隶属云挖掘数量型数据关联规则[J].潍坊学院学报,2008,8(2):12-15.
6李学明,李宾飞,杨涛,付萌.基于lazy方法的数量型关联分类[J].计算机应用,2013,33(8):2184-2187. 被引量：1
7汪维佳.数量型数据关联规则挖掘及其在通信行业用户分析中的应用[J].浙江统计,2005(3):28-30. 被引量：1
8王兆红.基于梯形云的数量型关联规则挖掘方法[J].信息技术与信息化,2005(6):98-100. 被引量：2

计算机研究与发展

2000年第7期

浏览历史

内容加载中请稍等...

一种测试数据挖掘算法的数据源生成方法被引量：16

参考文献3

二级参考文献5

共引文献1339

同被引文献208

引证文献16

二级引证文献335

相关作者

相关机构

相关主题

浏览历史

一种测试数据挖掘算法的数据源生成方法 被引量：16

参考文献3

二级参考文献5

共引文献1339

同被引文献208

引证文献16

二级引证文献335

相关作者

相关机构

相关主题

浏览历史

一种测试数据挖掘算法的数据源生成方法被引量：16