期刊文献+
共找到228篇文章
< 1 2 12 >
每页显示 20 50 100
基于Weka的急性淋巴细胞白血病图像的分类与优化研究
1
作者 史献乐 陈婷 +1 位作者 何宝林 周圆 《医疗卫生装备》 2025年第2期10-15,共6页
目的:提出一种基于Weka的急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)图像分类方法,以提高ALL细胞分类的准确性和稳定性。方法:首先,从急性淋巴细胞白血病图像数据库(Acute Lymphoblastic Leukemia Image Database,ALL-IDB)... 目的:提出一种基于Weka的急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)图像分类方法,以提高ALL细胞分类的准确性和稳定性。方法:首先,从急性淋巴细胞白血病图像数据库(Acute Lymphoblastic Leukemia Image Database,ALL-IDB)的子集ALL-IDB2中随机选取180张图像,包括90张患者图像和90张健康者图像;其次,利用ImageJ软件对图像进行预处理并提取纹理、边缘和形状等特征;再次,使用Weka中的随机森林(random forest,RF)、贝叶斯网络(Bayesian network,BN)、J48决策树和序列最小优化(sequential minimal optimization,SMO)4种分类器对图像进行分类,并对各分类器的关键参数进行优化;最后,使用独立的80张测试图像对分类器的性能进行验证。结果:参数优化前,RF、J48决策树、BN和SMO分类器的准确率分别为94.3%、86.2%、83.6%和83.0%,参数优化后,准确率分别为95.2%、86.3%、83.6%和89.7%。优化后,RF在独立测试集上表现最佳,分类准确率达到了90.0%,SMO和BN的性能次之(分类准确率均为81.3%),而J48决策树的表现相对较差(分类准确率为75.0%)。结论:基于Weka的ALL图像分类方法具有较高的分类精度,可为ALL细胞的自动化分类提供一种高效、可靠的解决方案。 展开更多
关键词 weka 急性淋巴细胞白血病 机器学习 图像分类 辅助诊断
在线阅读 下载PDF
基于Weka平台地球化学异常分类研究
2
作者 辛舒怡 张海洪 +2 位作者 朱骏 宋鹏飞 赵宇航 《吉林地质》 2024年第1期64-73,共10页
地球化学数据是应用地球化学研究的重要组成部分,是勘查工作的基础成果,地质地球化学数据的机器学习算法在研究地球化学异常分类中具有重要参考。本文以省内某区土壤地球化学Au、Cu等13种元素数据为基础,基于Weka平台J48决策树算法,对... 地球化学数据是应用地球化学研究的重要组成部分,是勘查工作的基础成果,地质地球化学数据的机器学习算法在研究地球化学异常分类中具有重要参考。本文以省内某区土壤地球化学Au、Cu等13种元素数据为基础,基于Weka平台J48决策树算法,对目标研究区域元素地球化学异常进行分类,在监督条件下结果表明,经过训练的模型基础上,异常分类测试集准确度89.8%、错误率10.1%,模型对异常分类具有较高准确度。异常的面积、nap值、断裂、浓集中心、矿床数量是最有效参数。 展开更多
关键词 大数据 机器学习 weka 地球化学 异常
在线阅读 下载PDF
WEKA数据挖掘平台及其二次开发 被引量:35
3
作者 陈慧萍 林莉莉 +1 位作者 王建东 苗新蕊 《计算机工程与应用》 CSCD 北大核心 2008年第19期76-79,共4页
在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA... 在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,并对嵌入的算法和原有聚类算法进行了对比分析。该算法改进了传统的k-中心点算法,避免陷入局部最优,而且它对初始点不太敏感,可以获取更好的聚类效果。 展开更多
关键词 数据挖掘 weka平台 聚类 k-中心点轮换算法
在线阅读 下载PDF
WEKA环境下基于模糊理论的聚类算法 被引量:15
4
作者 郑世明 苗壮 +1 位作者 宋自林 高志年 《解放军理工大学学报(自然科学版)》 EI 北大核心 2012年第1期22-26,共5页
因特网上的数据规模大、动态性强,通常发现的知识或规则很可能是不精确和不完备的。为了克服以上不足,引入模糊理论,通过寻找模糊相似上近似集进行合理聚类,在确定聚类数目的过程中,利用平均信息熵进行最佳聚类。同时将模糊聚类算法嵌入... 因特网上的数据规模大、动态性强,通常发现的知识或规则很可能是不精确和不完备的。为了克服以上不足,引入模糊理论,通过寻找模糊相似上近似集进行合理聚类,在确定聚类数目的过程中,利用平均信息熵进行最佳聚类。同时将模糊聚类算法嵌入WEKA平台,利用WEKA中的类和可视化功能,扩充了WEKA中的聚类算法。实验表明,算法对含有噪声的、分布不规则的大数据集具有很高的精度和收敛速度。 展开更多
关键词 模糊集 数据挖掘 模糊聚类 相似上近似 weka 聚类算法
在线阅读 下载PDF
基于Weka的城市建设用地结构特征挖掘研究 被引量:15
5
作者 孙元军 郑新奇 常伟倩 《计算机工程与应用》 CSCD 北大核心 2008年第27期231-235,共5页
城市建设用地结构是城市建设用地状况的直接反映,对其进行研究分析可以了解掌握城市建设用地的现状与内在规律。尝试使用Weka软件,运用其关联分析、聚类、回归方法中的不同算法对城市建设用地结构进行分析,获取了一些有益的结果:(1)通... 城市建设用地结构是城市建设用地状况的直接反映,对其进行研究分析可以了解掌握城市建设用地的现状与内在规律。尝试使用Weka软件,运用其关联分析、聚类、回归方法中的不同算法对城市建设用地结构进行分析,获取了一些有益的结果:(1)通过关联分析得到不同用地间的相关性;(2)通过聚类将全国城市分为5类,并分析了其空间分布特征,即存在均匀分布,又呈现相对聚集现象;(3)通过回归分析得知用地结构与城市规模之间存在一定联系。 展开更多
关键词 城市建设用地结构 数据挖掘 weka
在线阅读 下载PDF
基于WEKA的客户分类信息系统研究 被引量:10
6
作者 卢媛媛 张剑 何海燕 《计算机工程与科学》 CSCD 北大核心 2011年第5期132-135,共4页
本文采用决策树方法,对客户交易数据和客户基本信息进行数据挖掘分析,降低了数据冗余度,提高了数据集准确率。在RFM模型基础上,从客户交易信息中选取了购买频率和平均每次购买金额作为分类评估指标的补充,得到一组客户交易数据训练集。... 本文采用决策树方法,对客户交易数据和客户基本信息进行数据挖掘分析,降低了数据冗余度,提高了数据集准确率。在RFM模型基础上,从客户交易信息中选取了购买频率和平均每次购买金额作为分类评估指标的补充,得到一组客户交易数据训练集。结合J48算法使用WEKA算法对客户交易数据训练集进行训练、测试和验证,构建了客户分类决策模型,从而有利于客户分类原型系统的系统分析和系统设计。 展开更多
关键词 客户细分 数据挖掘 分类 决策树 weka
在线阅读 下载PDF
基于Weka读者借阅行为分析 被引量:20
7
作者 储文静 奉国和 《情报科学》 CSSCI 北大核心 2010年第3期424-429,共6页
图书管理系统借阅数据直接反映了读者的借阅行为,对其研究可以了解读者的借阅习惯。使用Weka软件,运用其关联分析、聚类中的不同算法对华南师范大学2008年研究生图书借阅数据进行分析,获取了一些有益的分析结果,对提高图书馆的服务起到... 图书管理系统借阅数据直接反映了读者的借阅行为,对其研究可以了解读者的借阅习惯。使用Weka软件,运用其关联分析、聚类中的不同算法对华南师范大学2008年研究生图书借阅数据进行分析,获取了一些有益的分析结果,对提高图书馆的服务起到一定的帮助作用。 展开更多
关键词 weka 借阅数据 借阅行为分析
原文传递
基于WEKA的客户流失预测研究 被引量:5
8
作者 尹婷 覃锡忠 +1 位作者 贾振红 马军 《激光杂志》 CAS CSCD 北大核心 2013年第5期44-46,共3页
针对电信企业客户流失问题,提出一种基于Weka平台知识自动获取的客户流失预测模型。针对决策树算法偏向于选择取值较多的属性作为测试属性的缺点,结合OIR算法选择相关属性子集进行分类,降低相关度较小属性与重复属性对分类的影响。通过... 针对电信企业客户流失问题,提出一种基于Weka平台知识自动获取的客户流失预测模型。针对决策树算法偏向于选择取值较多的属性作为测试属性的缺点,结合OIR算法选择相关属性子集进行分类,降低相关度较小属性与重复属性对分类的影响。通过在Weka平台上使用6个UCI数据集和移动公司客户数据的实验结果表明,优化后的决策树算法克服了决策树算法的取值偏置问题,从而获得比J48算法更高分类准确率。 展开更多
关键词 数据挖掘 决策树 OIR算法 客户流失 weka平台
在线阅读 下载PDF
WEKA环境下模拟预测城市污水处理厂泥饼含水率 被引量:3
9
作者 李佟 李军 付强 《中国给水排水》 CAS CSCD 北大核心 2015年第19期76-79,共4页
以7座污水处理厂的20 000多个数据为依据,首先通过灰色关联法确定了对泥饼含水率具有显著影响的指标与输入变量,在此基础上,以WEKA为工具平台,采用M5P分类回归算法对污水厂泥饼含水率指标进行建模,并进行了模拟校核与预测。模拟校核结... 以7座污水处理厂的20 000多个数据为依据,首先通过灰色关联法确定了对泥饼含水率具有显著影响的指标与输入变量,在此基础上,以WEKA为工具平台,采用M5P分类回归算法对污水厂泥饼含水率指标进行建模,并进行了模拟校核与预测。模拟校核结果表明,WEKA下的M5P算法非常适合于既包含数值型又包含分类型的复合指标组模拟,对于污水厂污泥脱水具有很好的模拟效果。模拟预测结果显示,泥饼含水率预测值和实际值吻合程度较好,平均绝对误差为1.18、均方根误差为1.59。模型可良好地应用于城市污水处理厂泥饼含水率的预测分析,对于污水厂的生产运行具有一定的指导意义。 展开更多
关键词 泥饼 含水率 数据挖掘 weka M5P算法
原文传递
基于Weka平台知识获取的航空发动机磨损故障诊断专家系统 被引量:8
10
作者 葛科宇 陈果 《机械科学与技术》 CSCD 北大核心 2011年第11期1955-1959,1964,共6页
针对航空发动机磨损故障诊断专家系统知识获取难的问题。提出了一种基于Weka平台知识自动获取的航空发动机磨损故障专家系统模型。引入目前国际上著名的数据挖掘软件Weka,并把它嵌入自己开发的专家系统中作为一个知识自动获取模块。阐述... 针对航空发动机磨损故障诊断专家系统知识获取难的问题。提出了一种基于Weka平台知识自动获取的航空发动机磨损故障专家系统模型。引入目前国际上著名的数据挖掘软件Weka,并把它嵌入自己开发的专家系统中作为一个知识自动获取模块。阐述了C4.5决策树中连续属性的离散、树的构建、树的修剪及规则的产生等关键技术。采集了一组某型航空发动机实测油样光谱数据,利用基于Weka平台的C4.5决策树提取了发动机磨损故障知识规则。 展开更多
关键词 weka C4.5决策树 磨损故障 知识获取 专家系统
在线阅读 下载PDF
Weka平台上解决聚类的改进差分进化算法 被引量:4
11
作者 姜凯 左风朝 《计算机工程与设计》 CSCD 北大核心 2012年第2期591-594,600,共5页
针对K均值算法的缺陷,提出一种用于解决聚类问题的差分进化算法对聚类的准则函数进行优化,为了能够进一步增强算法的全局搜索能力,引入一种基于种群适应度方差的自适应策略来动态调整变异概率CR和规模因子F等参数,充分利用在Weka工具中... 针对K均值算法的缺陷,提出一种用于解决聚类问题的差分进化算法对聚类的准则函数进行优化,为了能够进一步增强算法的全局搜索能力,引入一种基于种群适应度方差的自适应策略来动态调整变异概率CR和规模因子F等参数,充分利用在Weka工具中的类和接口,并将新提出的算法嵌入到平台中。在Weka平台上将该算法与K均值算法在3个UCI数据集上进行比较。仿真实验结果表明,该算法能够有效克服K均值算法的缺陷,能够获得较高的聚类质量。 展开更多
关键词 聚类 自适应差分进化算法 适应度方差 K均值 weka平台
在线阅读 下载PDF
基于Weka的冲击地压预测方法分析 被引量:2
12
作者 石永奎 李鹏瑞 +2 位作者 王英 甄恩泽 张云朝 《煤炭技术》 CAS 北大核心 2015年第5期219-221,共3页
在运用Weka平台对样本训练和预测时,发现用不同的数据挖掘算法,得到不一样的处理结果。以冲击地压危险程度数据作为样本,利用Weka、Excel和Ultra Edit等软件,分别采用支持向量机,决策树和朴素贝叶斯分类器进行训练和预测。从详细的精度... 在运用Weka平台对样本训练和预测时,发现用不同的数据挖掘算法,得到不一样的处理结果。以冲击地压危险程度数据作为样本,利用Weka、Excel和Ultra Edit等软件,分别采用支持向量机,决策树和朴素贝叶斯分类器进行训练和预测。从详细的精度,混淆矩阵和节点错误率这3个方面分别比较3种算法,从而得到结论是:贝叶斯分类器的训练和预测效果是最好的,不仅可以提高准确率,还具有一定的研究价值。 展开更多
关键词 weka 支持向量机 决策树 朴素贝叶斯分类器
原文传递
WEKA中的Id3决策树算法 被引量:7
13
作者 李四海 张忠文 《长春大学学报》 2011年第2期67-69,共3页
ID3算法是决策树学习归纳和数据挖掘中的核心方法。本文对ID3算法及其在WEKA中的实现进行了阐述,给出了使用剪枝阈值对决策树进行先剪枝的方法,最后通过实例对该方法的有效性进行了验证。
关键词 决策树 ID3 weka pruning—threshold
在线阅读 下载PDF
基于WEKA平台的湖库富营养化程度智能评价研究 被引量:2
14
作者 易仲强 刘德富 《水电能源科学》 北大核心 2010年第4期40-42,80,共4页
基于WEKA平台分别采用三种机器学习分类算法,构建了湖库富营养化程度的智能评价模型,分析了我国24个湖库的营养状态并进行了评价与比较。结果表明,该智能评价模型分辨率较高,建模方法简便易行、计算快捷、无需编程即能轻松实现,具有应... 基于WEKA平台分别采用三种机器学习分类算法,构建了湖库富营养化程度的智能评价模型,分析了我国24个湖库的营养状态并进行了评价与比较。结果表明,该智能评价模型分辨率较高,建模方法简便易行、计算快捷、无需编程即能轻松实现,具有应用价值,可供借鉴。 展开更多
关键词 weka 富营养化 神经网络 支持向量机 评价
在线阅读 下载PDF
基于Weka平台的C4.5算法在影像分类中的应用 被引量:5
15
作者 马晶 蒲伦 +1 位作者 徐月 李旭 《测绘与空间地理信息》 2017年第5期52-55,共4页
遥感图像分类是从复杂的地物类型中提取有效类别信息的过程。在研究区地物类型较为复杂的情况下,借助计算机对遥感数据进行类别预测可以提高分类效率和准确率。本文基于Weka平台,利用决策树C4.5算法构造分类模型,进而对未知类别数据进... 遥感图像分类是从复杂的地物类型中提取有效类别信息的过程。在研究区地物类型较为复杂的情况下,借助计算机对遥感数据进行类别预测可以提高分类效率和准确率。本文基于Weka平台,利用决策树C4.5算法构造分类模型,进而对未知类别数据进行预测。实验分析表明,基于Weka平台利用决策树C4.5算法对遥感图像分类是可行且有效的,且分类精度较高。 展开更多
关键词 weka平台 遥感图像分类 决策树算法 离散化
在线阅读 下载PDF
决策树算法在Weka平台上的数据挖掘应用 被引量:10
16
作者 程斐斐 王子牛 侯立铎 《微型电脑应用》 2015年第6期63-65,共3页
决策树算法可以对数据集进行有效的训练学习和快速准确的分类,其中ID3算法是最早提出的一种决策树算法,但是,此算法只适用于处理取值较多属性的数据,不能处理连续数据,对噪声也比较敏感。C4.5算法是对ID3算法的优化,不仅可以对连续值属... 决策树算法可以对数据集进行有效的训练学习和快速准确的分类,其中ID3算法是最早提出的一种决策树算法,但是,此算法只适用于处理取值较多属性的数据,不能处理连续数据,对噪声也比较敏感。C4.5算法是对ID3算法的优化,不仅可以对连续值属性进行处理,而且增加了对空值数据的处理功能。在研究和分析主流决策树算法基础上,针对二手汽车数据库在Weka数据挖掘平台进行了C4.5算法的设计与实现。实验结果表明该算法对预测数据集中的相应属性能进行较为准确的预测。 展开更多
关键词 决策树算法 ID3 C4.5 weka
在线阅读 下载PDF
基于决策树分类的Weka平台上数据挖掘应用 被引量:4
17
作者 王继魁 吕凯 李虹 《白城师范学院学报》 2013年第5期37-40,共4页
数据挖掘中的决策树分类可以对数据集进行有效的训练学习以及对新的相应数据集快速准确的分类.本文给出了一个利用Weka数据挖掘工具进行决策树分类的实例.
关键词 数据挖掘 决策数分类 weka
在线阅读 下载PDF
谱聚类方法研究及其在Weka中的实现 被引量:1
18
作者 李春贵 王萌 《计算机工程与设计》 CSCD 北大核心 2008年第13期3384-3386,3421,共4页
介绍了谱聚类方法的基本原理和算法思想,针对谱聚类方法优化问题求解的困难,分析了一种有原则的求解策略,从而给出算法的具体描述,并作为一个插件在Weka上进行了实现。对实现的系统进行了实验和测试,指出了应用中的关键问题。实验结果表... 介绍了谱聚类方法的基本原理和算法思想,针对谱聚类方法优化问题求解的困难,分析了一种有原则的求解策略,从而给出算法的具体描述,并作为一个插件在Weka上进行了实现。对实现的系统进行了实验和测试,指出了应用中的关键问题。实验结果表明,谱聚类方法效果优于K-means方法。 展开更多
关键词 谱聚类 图分割 优化离散解 weka接口 谱聚类类
在线阅读 下载PDF
基于WEKA点击流数据的读者需求可视化分析 被引量:5
19
作者 张源漳 《图书馆论坛》 CSSCI 北大核心 2007年第4期67-69,共3页
基于读者浏览行为建立点击流数据,采用WEKA挖掘软件对这些数据进行可视化分析,为掌握读者的信息需求规律,创新传统服务模式提供一种思路。
关键词 点击流 weka 可视化
在线阅读 下载PDF
基于Weka和协同机器学习技术的数据挖掘方法研究 被引量:12
20
作者 谭成兵 周湘贞 朱云飞 《长春大学学报》 2020年第12期5-9,共5页
为了提高数据挖掘准确度,提出了一种基于Weka和协同机器学习技术的数据挖掘方法。将Weka平台中具有相同训练结果的算法分至同组,且给每个算法得到的结果赋予权重因子。然后,采用蛙跳算法对权重因子进行训练,将训练得到的权重因子按照不... 为了提高数据挖掘准确度,提出了一种基于Weka和协同机器学习技术的数据挖掘方法。将Weka平台中具有相同训练结果的算法分至同组,且给每个算法得到的结果赋予权重因子。然后,采用蛙跳算法对权重因子进行训练,将训练得到的权重因子按照不同的组进行求和。最后将最大的一组所对应结果作为样本的训练输出,以实现不同机器学习算法协同。结果表明,相比于单个机器学习算法的数据挖掘,采用协同机器学习的数据挖掘准确度更高,稳定性更强。 展开更多
关键词 weka平台 协同机器学习 数据挖掘 权重因子 蛙跳算法
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部