期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于MRMR和SVM的短文本分类算法改进研究 被引量:1
1
作者 章启超 周莲英 丁腊春 《计算机与数字工程》 2025年第1期164-169,共6页
特征集质量和分类器性能是影响短文本分类效果的两个重要因素。具有最大特征最小冗余特点的MRMR算法是目前常用的特征降维算法,论文通过基于词分布频率的调节因子改进该算法,调节因子会在计算特征互信息值的时候降低低频特征词的权重,... 特征集质量和分类器性能是影响短文本分类效果的两个重要因素。具有最大特征最小冗余特点的MRMR算法是目前常用的特征降维算法,论文通过基于词分布频率的调节因子改进该算法,调节因子会在计算特征互信息值的时候降低低频特征词的权重,解决低频词语与特征标签之间高依赖的问题。之后以支持向量机为基础分类器,通过加入了变步长因子的萤火虫算法对其进行参数寻优,变步长因子的自适应性解决了萤火虫算法出现的震荡等现象,最后利用Adaboost框架迭代训练出多个不同权重的SVM基础分类器,集成得到性能更优的强分类器。论文使用网络爬虫获取的短文本数据集进行验证,以精确率(P)、召回率(R)、F1值做为评估标准,优化后的算法相比原算法在精确率上提高8%,召回率提高10%,F1值提高9%,因此实验结果表明优化后的算法具有更高的效率。 展开更多
关键词 短文本分类 特征降维 mrmr算法 支持向量机 ADABOOST
在线阅读 下载PDF
基于AdaBoost模型和mRMR算法的小麦白粉病遥感监测 被引量:19
2
作者 马慧琴 黄文江 +6 位作者 景元书 董莹莹 张竞成 聂臣巍 唐翠翠 赵晋陵 黄林生 《农业工程学报》 EI CAS CSCD 北大核心 2017年第5期162-169,共8页
除选择合适的建模方法外,选择合适的特征选择算法来优选建模特征对提高作物病害的遥感监测水平具有重要作用。选取陕西省关中平原西部小麦白粉病为对象,基于Landsat 8遥感影像共提取了18个特征变量,通过相关性分析(correlation analysis... 除选择合适的建模方法外,选择合适的特征选择算法来优选建模特征对提高作物病害的遥感监测水平具有重要作用。选取陕西省关中平原西部小麦白粉病为对象,基于Landsat 8遥感影像共提取了18个特征变量,通过相关性分析(correlation analysis,CA)和最小冗余最大相关(minimum redundancy maximum relevance,mRMR)2种特征选择算法筛选出了2组不同的特征变量,分别将其输入Fisher线性判别分析(Fisher linear discriminant analysis,FLDA)、支持向量机(support vector machine,SVM)和AdaBoost 3种方法,构建小麦白粉病发生严重程度监测模型,并对其进行精度验证与对比分析。结果表明,2种AdaBoost模型对小麦白粉病发生严重程度的总体监测精度分别比FLDA模型和SVM模型高出27.9%、27.9%和14.0%、9.3%,mRMR算法筛选特征所建FLDA、SVM及AdaBoost监测模型的总体监测精度分别比CA筛选特征所建模型高出7.0%、11.7%和7.0%,且mRMR算法筛选特征结合AdaBoost方法所建监测模型的精度和Kappa系数分别为88.4%和0.807,为所有模型中最高。说明将AdaBoost方法用于作物病害遥感监测效果较好,在作物病害监测模型的特征变量选择中mRMR算法比常用CA算法更具优势。研究结果可为其他作物病害遥感监测提供方法参考。 展开更多
关键词 病害 遥感 监测 小麦 mrmr算法 ADABOOST方法
在线阅读 下载PDF
基于GF-1遥感影像和relief-mRMR-GASVM模型的小麦白粉病监测 被引量:15
3
作者 黄林生 阮超 +3 位作者 黄文江 师越 彭代亮 丁文娟 《农业工程学报》 EI CAS CSCD 北大核心 2018年第15期167-175,314,共10页
选择合适的建模和特征选择算法对提高作物病害的遥感监测水平有着重要的作用。研究以河北省小麦白粉病为研究对象,基于GF-1/WFV数据共提取了4个波段反射率数据和10个对作物长势和胁迫敏感的植被指数作为初选特征。针对常用的特征提取算... 选择合适的建模和特征选择算法对提高作物病害的遥感监测水平有着重要的作用。研究以河北省小麦白粉病为研究对象,基于GF-1/WFV数据共提取了4个波段反射率数据和10个对作物长势和胁迫敏感的植被指数作为初选特征。针对常用的特征提取算法relief算法筛选出的特征存在冗余性的问题,提出了一种relief结合最小冗余最大相关(minimum redundancy maximum relevance,m RMR)的特征降维算法(relief-m RMR)。首先,通过relief算法计算出各特征的权重系数,对特征集进行加权;然后利用m RMR算法选出与类别具有最小冗余性的特征,利用支持向量机(support vector machine,SVM)对河北白粉病进行监测,并用遗传算法(genetic algorithm,GA)优化的SVM(GASVM)建立了白粉病的监测模型(relief-m RMR-GASVM),将监测结果分别与SVM和网格寻优(grid search,GS)算法优化的SVM(GSSVM)的监测结果进行对比分析,同时比较了该方法与Ada Boost、粒子群(Pso)优化的最小二乘支持向量机(least squares support vector machine,Pso-LSSVM)和随机森林(random forest,RF)3种方法的优越性。结果表明,relief-m RMR算法筛选出的特征与GASVM、SVM和GSSVM建立的监测模型精度比传统relief算法筛选特征所建模型的精度分别提高了14.3个百分点、7.2个百分点和7.1个百分点,比传统m RMR算法筛选特征所建模型的精度分别提高了14.3个百分点、14.3个百分点和14.2个百分点。relief-m RMR算法结合GASVM建立的监测模型精度为所有模型中最高,精度为85.7个百分点,分别比SVM和GSSVM所建监测模型精度提高了21.4个百分点和7.2个百分点。此外,GF-1数据结合relief-m RMR-GASVM模型的监测精度分别高出Ada Boost、Pso-LSSVM和RF方法21.4个百分点、14.3个百分点和7.1个百分点。说明GF-1数据结合relief-m RMR-GASVM模型可用于小麦白粉病的遥感监测。 展开更多
关键词 病害 遥感 监测 小麦 白粉病 支持向量机 RELIEF算法 mrmr算法
在线阅读 下载PDF
Relief-MRMR-SVM在煤矸图像分类的研究 被引量:2
4
作者 张释如 朱萌 《煤炭工程》 北大核心 2022年第4期139-144,共6页
煤和矸石的图像分类是实现煤矸自动分选的关键环节。为提高煤矸分选模型的准确性和稳定性,提出了一种结合Relief、MRMR算法及SVM分类器构建的混合式特征选择及分类方法,提取煤矸图像的颜色及纹理共26个特征对其分类进行研究。在提取纹... 煤和矸石的图像分类是实现煤矸自动分选的关键环节。为提高煤矸分选模型的准确性和稳定性,提出了一种结合Relief、MRMR算法及SVM分类器构建的混合式特征选择及分类方法,提取煤矸图像的颜色及纹理共26个特征对其分类进行研究。在提取纹理时联合使用了LBP局部和GLCM全局特征,有助于提高分类的准确性。利用该特征选择方法选出最优特征子集后,用粒子群和支持向量机算法构建PSO-SVM最佳参数模型进行煤矸分类。结果显示,该方法能剔除较多冗余特征,提高煤矸分类的效率;在两个数据集上,该模型的平均分类准确率分别达到96.12%和94.17%,证明了方法的有效性和模型的稳定性。 展开更多
关键词 图像分类 特征选择 最大相关最小冗余算法 局部二值模式 煤和矸石
在线阅读 下载PDF
基于mRMR与基尼重要性的树突状细胞模型 被引量:2
5
作者 张凯林 董红斌 《计算机工程》 CAS CSCD 北大核心 2023年第5期129-138,共10页
树突状细胞算法(DCA)模拟人体免疫系统中树突状细胞对抗原的识别与提呈过程,是一种快速有效的异常检测方法,其关键是从数据中选取有效特征以表示特定的输入信号。然而,现有信号选取方法存在特征子集冗余、时间复杂度高等问题,导致生成... 树突状细胞算法(DCA)模拟人体免疫系统中树突状细胞对抗原的识别与提呈过程,是一种快速有效的异常检测方法,其关键是从数据中选取有效特征以表示特定的输入信号。然而,现有信号选取方法存在特征子集冗余、时间复杂度高等问题,导致生成的抗原信号有效性较低,且在高维大样本数据集上运行速度较慢。考虑抗原信号的可用性与信号选取过程的时间效率,提出基于最大相关最小冗余(mRMR)与基尼重要性的树突状细胞模型MRGI-DCA。通过mRMR从原始数据集中快速地提取最相关特征子集,且最大限度地降低特征子集的冗余性。在mRMR预降维的基础上,根据CART树模型快速、准确等特点,利用基尼重要性得到更有效的抗原信号。实验结果表明,MRGI-DCA总体表现优于IG-DCA、COR-DCA、GA-DCA和SVM-DCA方法,其中,准确率、F1值和AUC在高维、低维、异常数据集上的平均值较COR-DCA分别提高6.01%、5.86%、9.96%,并且平均运行时间约为COR-DCA的1/5。 展开更多
关键词 树突状细胞算法 信号选取 最大相关最小冗余算法 基尼重要性 人工免疫系统
在线阅读 下载PDF
基于改进的MRMR算法和代价敏感分类的财务预警研究 被引量:13
6
作者 罗康洋 王国强 《统计与信息论坛》 CSSCI 北大核心 2020年第3期77-85,共9页
针对上市公司财务预警数据呈现出的高维和不平衡的双重特性,基于改进的MRMR算法和代价敏感分类构建财务预警模型并进行实证分析。首先,为了克服财务预警数据的不平衡性对特征选择和分类的不利影响,使用组合采样技术SMOTE+ENN进行数据平... 针对上市公司财务预警数据呈现出的高维和不平衡的双重特性,基于改进的MRMR算法和代价敏感分类构建财务预警模型并进行实证分析。首先,为了克服财务预警数据的不平衡性对特征选择和分类的不利影响,使用组合采样技术SMOTE+ENN进行数据平衡化处理。其次,利用绝对值余弦度量构建改进的MRMR算法并进行特征选择。最后,将支持向量机、L2-逻辑回归和CART决策树及其对应代价敏感模型作为比较模型进行财务预警研究。通过大量实证分析显示,SMOTE+ENN的引入有效提升了ST公司样本及其对应特征的重要性。在不影响财务预警模型总体分类性能的前提下,改进的MRMR算法可以得到更为简洁的预测特征集,且组合模型MRMR_FDAQ+CSSVM的预测结果最优,因此建议优先将该模型应用于上市公司财务危机的预测。 展开更多
关键词 高维数据 不平衡数据集 财务预警 mrmr算法 代价敏感分类模型
在线阅读 下载PDF
mRMR和PSO算法对神经网络预测模型优化效果
7
作者 杜润琪 于丹 +1 位作者 刘益民 岑悦 《煤气与热力》 2024年第1期6-9,34,共5页
提出利用最大相关和最小冗余(mRMR)算法、粒子群优化(PSO)算法,对BP神经网络预测模型进行优化。对某住宅楼进行供热负荷预测,评价3种神经网络预测模型(BP神经网络预测模型、mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型)的预... 提出利用最大相关和最小冗余(mRMR)算法、粒子群优化(PSO)算法,对BP神经网络预测模型进行优化。对某住宅楼进行供热负荷预测,评价3种神经网络预测模型(BP神经网络预测模型、mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型)的预测效果。在3种神经网络预测模型中,BP神经网络预测模型的预测效果最差,PSO-mRMR-BP神经网络预测模型的预测效果最佳。与BP神经网络预测模型相比,经过mRMR算法对输入变量进行筛选以及PSO算法对初始参数进行优化,PSO-mRMR-BP神经网络预测模型的预测效果显著提高。 展开更多
关键词 供热负荷 预测 BP神经网络 mrmr算法 PSO算法
在线阅读 下载PDF
基于mRMR算法的滑坡多源特征选择 被引量:2
8
作者 张垚 《微处理机》 2023年第5期27-30,共4页
鉴于特征选择在滑坡灾害预测和预警中的重要性,为降低数据复杂度和提高预报模型的准确性,以陕西省子洲县滑坡重点整治示范区的监测数据为研究对象,提出一种基于最大相关最小冗余(mRMR)算法的滑坡灾害多源特征选择方法。通过对滑坡灾害... 鉴于特征选择在滑坡灾害预测和预警中的重要性,为降低数据复杂度和提高预报模型的准确性,以陕西省子洲县滑坡重点整治示范区的监测数据为研究对象,提出一种基于最大相关最小冗余(mRMR)算法的滑坡灾害多源特征选择方法。通过对滑坡灾害多源特征数据进行处理和分析,使用该算法选择出具有代表性和区分度的特征。实验结果表明,该方法可以有效选择出影响滑坡灾害发生的重要特征,特征选择后可减少传统传感器布置数量,降低初期投资成本,同时降低算法难度及计算时间并提高预报的准确性和实时性。 展开更多
关键词 特征选择 mrmr算法 滑坡灾害
在线阅读 下载PDF
基于mRMR-BP算法的辛烷值损失预测模型研究 被引量:1
9
作者 姬子恒 朱建伟 陈海江 《智能计算机与应用》 2022年第3期169-172,179,共5页
化工过程建模一般通过数据关联或机理建模的方法来实现,但由于炼油工艺过程的复杂性以及设备的多样性,其操作变量之间具有高度非线性和相互强耦联的关系。在传统的数据关联模型中,变量相对较少、机理建模对原料的分析要求较高,对过程优... 化工过程建模一般通过数据关联或机理建模的方法来实现,但由于炼油工艺过程的复杂性以及设备的多样性,其操作变量之间具有高度非线性和相互强耦联的关系。在传统的数据关联模型中,变量相对较少、机理建模对原料的分析要求较高,对过程优化的响应不及时,效果并不理想。本文为了降低模型求解的复杂性,使用互信息法和mRMR算法,对367个变量进行降维处理,筛选出同时满足与辛烷值之间具有最大相关性,彼此之间又有最小的冗余性的主要变量。引入BP神经网络模型对辛烷值损失建立预测模型,经过数据训练与学习,产生辛烷值损失的预测结果,并分析主要操作变量对辛烷值损失的影响。 展开更多
关键词 辛烷值 互信息法 最大相关-最小冗余(mrmr)算法 BP神经网络
在线阅读 下载PDF
基于mRMR-SOM的异步电机轴承故障诊断研究
10
作者 刘文 周智勇 蔡巍 《机电工程》 北大核心 2024年第1期90-98,共9页
针对异步电机轴承故障诊断问题,提出了一种融合最大相关最小冗余特征选择算法(mRMR)和自组织映射神经网络(SOM)的故障诊断方法,并将其应用于轴承故障诊断的不同阶段。首先,在实验室环境下搭建了异步电机故障诊断试验平台,在不同电机状... 针对异步电机轴承故障诊断问题,提出了一种融合最大相关最小冗余特征选择算法(mRMR)和自组织映射神经网络(SOM)的故障诊断方法,并将其应用于轴承故障诊断的不同阶段。首先,在实验室环境下搭建了异步电机故障诊断试验平台,在不同电机状态下分别采集振动、电流和电压信号,利用统计学方法获取了高维混合特征集;然后,以互信息为背景,利用mRMR根据特征与状态标签间的相关性和特征间的冗余性,筛选了具备强区分能力的特征,以避免计算冗余和后验诊断性能下降;最后,采用SOM对异步电机健康和轴承故障状态进行了分类识别,验证了SOM对异步电机轴承故障诊断的有效性,以及mRMR对故障诊断结果的影响。研究结果表明:基于mRMR-SOM的异步电机轴承故障诊断方法能够准确地区分健康和故障状态,测试集分类准确率达到89%;使用mRMR特征筛选能够将154维特征降低至17维,缩短23.5%的网络收敛时间,并将分类准确率由89%提升至98%;试验结果验证了基于mRMR-SOM的异步电机轴承故障诊断方法对于异步电机轴承故障诊断问题的有效性,且证实其具备良好的诊断效果。 展开更多
关键词 自组织映射神经网络 最大相关最小冗余特征选择算法 互信息 特征降维 特征选择 神经网络算法 U矩阵
在线阅读 下载PDF
基于三层加权堆叠模型的电动汽车剩余里程预测
11
作者 石琴 侯伟路 +2 位作者 张晓楠 吴为教 贺泽佳 《汽车工程》 北大核心 2025年第1期107-116,共10页
为实现电动汽车剩余里程准确预测,本文提出一种基于三层加权堆叠模型的电动汽车剩余里程预测方法。结合最大信息系数和斯皮尔曼系数作为变量评价准则,使用最小冗余最大相关算法从候选特征集中优化得到输入特征集。构建考虑原始训练特征... 为实现电动汽车剩余里程准确预测,本文提出一种基于三层加权堆叠模型的电动汽车剩余里程预测方法。结合最大信息系数和斯皮尔曼系数作为变量评价准则,使用最小冗余最大相关算法从候选特征集中优化得到输入特征集。构建考虑原始训练特征的三层堆叠模型,并利用贝叶斯优化算法得到堆叠模型中基模型权重。最后,使用输入特征集对三层加权堆叠模型训练并实现电动汽车剩余里程预测,结果表明所述三层加权堆叠模型的预测精度较高。此外,与其他模型相比,所述堆叠三层加权模型的泛化能力更强。 展开更多
关键词 电动汽车 mrmr算法 Stacking模型 剩余里程
在线阅读 下载PDF
基于小腿表面肌电的智能机器人协同控制方法 被引量:14
12
作者 徐超立 林科 +2 位作者 杨晨 吴超华 高小榕 《中国生物医学工程学报》 CAS CSCD 北大核心 2016年第4期385-393,共9页
作为人机交互的核心内容之一,面向机器人控制的步态识别拥有广泛的应用前景。提出一种基于小腿表面肌电信号的智能移动机器人控制方法。通过优化互信息的最大相关最小冗余算法(MRMR),实现对前进、后退、左转、右转等4种步态分类识别,并... 作为人机交互的核心内容之一,面向机器人控制的步态识别拥有广泛的应用前景。提出一种基于小腿表面肌电信号的智能移动机器人控制方法。通过优化互信息的最大相关最小冗余算法(MRMR),实现对前进、后退、左转、右转等4种步态分类识别,并建立一套移动机器人同步控制系统。使用表面肌电信号(sEMG)作为输入信息,对人步态动作进行分类识别,并转化为对机器人运动进行控制的信息,从而实现人与智能移动机器人的实时协同交互。通过采集8名受试者前进、后退、左转、右转行走时的小腿表面肌电信号,并实时控制智能机器人的运动。结果表明,在少量的训练条件下,该方法的步态识别准确率可达88%。基于此方法搭建的移动机器人协同控制系统,具有较强的实时控制能力以及较高的控制准确度。基于小腿表面肌电的智能机器人协同控制方法具有良好的应用前景,未来或可广泛应用于人机运动协调机器人控制等领域。 展开更多
关键词 小腿表面肌电信号 步态识别 最大相关最小冗余算法 智能机器人
暂未订购
基于特征权重与词间相关性的文本特征选择算法 被引量:3
13
作者 任永功 杨荣杰 尹明飞 《计算机应用与软件》 CSCD 北大核心 2012年第9期33-36,共4页
传统的ReliefF算法使用二值法不能体现离散特征差异大小,且不能去除冗余特征。针对这种情况提出了mRMR-ReliefF特征选择算法。该算法利用概率弥补特征差异度量上的不足,提出新的差异函数。此函数使提取出的特征更能体现文本的类内相关... 传统的ReliefF算法使用二值法不能体现离散特征差异大小,且不能去除冗余特征。针对这种情况提出了mRMR-ReliefF特征选择算法。该算法利用概率弥补特征差异度量上的不足,提出新的差异函数。此函数使提取出的特征更能体现文本的类内相关性和类间差异性。该算法还结合了词间相关性。词间相关性在考虑选择和类别相关性大的特征词的同时还考虑了特征冗余的消除。通过三种算法的对比实验,表明该算法为文本分类提供了更有效的特征子集。 展开更多
关键词 RELIEFF算法 mrmr-ReliefF算法 特征选择 差异函数 词间相关性 文本分类
在线阅读 下载PDF
面向胎盘植入产前诊断的医学语义特征提取算法 被引量:7
14
作者 潘晓晓 叶东毅 +2 位作者 颜建英 张栋 杨丹林 《模式识别与人工智能》 EI CSCD 北大核心 2015年第6期481-489,共9页
胎盘植入由于其临床特征隐匿,尚无一种敏感性、特异性高的产前诊断手段,因此文中将数据的特征提取方法引入胎盘植入产前诊断领域,从特征相关性的角度,提出胎盘植入有效医学语义的多目标特征优化问题,并给出求解该问题的一种改进的非支... 胎盘植入由于其临床特征隐匿,尚无一种敏感性、特异性高的产前诊断手段,因此文中将数据的特征提取方法引入胎盘植入产前诊断领域,从特征相关性的角度,提出胎盘植入有效医学语义的多目标特征优化问题,并给出求解该问题的一种改进的非支配排序遗传算法II(NSGA-II).基于实际胎盘植入相关临床数据的计算结果表明,文中算法能从复杂的胎盘植入相关临床数据中提取具有胎盘植入有效语义的特征集合.经过接收者操作特征(ROC)曲线分析,提取的特征医学语义具有较高的诊断价值,可为产科医师研究胎盘植入的发病机制和及时产前诊断提供有效的辅助手段.文中研究还发现,一些临床生化检查指标具有重要作用,可作为胎盘植入产前诊断的有效依据. 展开更多
关键词 胎盘植入(PA) 特征选择 最大相关和最小冗余算法( mrmr) 非支配排序遗传算法II (NSGA-II)
在线阅读 下载PDF
非均衡数据的债券违约预警研究
15
作者 程建华 徐恒宇 《重庆工商大学学报(自然科学版)》 2021年第3期86-93,共8页
将上海交易所和深证交易所发行的30只违约债券和468只未违约债券作为研究样本,将债券是否违约设定为一个二分类问题进行识别分析,针对该问题构建了基于SVM的ADmR-AdaboostSVM分类模型;从企业资本结构、盈利能力、现金流量、偿债能力4个... 将上海交易所和深证交易所发行的30只违约债券和468只未违约债券作为研究样本,将债券是否违约设定为一个二分类问题进行识别分析,针对该问题构建了基于SVM的ADmR-AdaboostSVM分类模型;从企业资本结构、盈利能力、现金流量、偿债能力4个评估因素中筛选16个预警指标,运用ADASYN方法进行过采样合成新样本点,将特征提取mRMR方法引入债券违约领域,得出长期负债率、资本收益率、成本费用利润率以及股权比例这4个变量作为债券违约的最终预警指标,在此基础上运用AdaboostSVM模型进行风险识别。研究结果表明:在建模过程中克服了样本非均衡化问题使得分类精度显著提高,同时通过解决高维数据冗余问题,识别违约债券的准确率进一步提高,反复验证表明该模型具有较强的稳健性和有效性,具有一定的应用价值。 展开更多
关键词 债券违约 ADASYN算法 mrmr算法 AdaboostSVM
在线阅读 下载PDF
低维快速DNS-over-HTTPS隧道流量检测方法
16
作者 王涛 翟江涛 +2 位作者 王子豪 张凯杰 刘光杰 《网络空间安全科学学报》 2024年第6期123-130,共8页
安全DNS协议DNS-over-HTTPS(DoH)的标准化和部署应用,使DoH隧道成为一种新的隐蔽性网络威胁并受到广泛关注。在云网络环境中对大规模DoH业务流量中潜在的隧道流量进行甄别,需要同时兼顾计算效率和准确率。针对当前基于机器学习的DoH隧... 安全DNS协议DNS-over-HTTPS(DoH)的标准化和部署应用,使DoH隧道成为一种新的隐蔽性网络威胁并受到广泛关注。在云网络环境中对大规模DoH业务流量中潜在的隧道流量进行甄别,需要同时兼顾计算效率和准确率。针对当前基于机器学习的DoH隧道检测算法特征效率低、计算复杂度高的问题,设计了一组数据包块长度特征并提出了一种基于最大相关最小冗余(max-Relevance and Min-Re-dundancy,mRMR)特征筛选算法和随机森林算法的低维快速DoH隧道检测方法,该方法通过特征筛选选取对DoH隧道检测任务贡献大的特征,并使用随机森林分类器进行DoH隧道检测任务。实验结果表明,该方法在仅使用10维特征的情况下,达到了与使用24~34维特征的其他算法相当的准确率,可有效降低部署应用的计算复杂度,更好地适应大规模DoH业务流量分析的应用场景。 展开更多
关键词 DNS-over-HTTPS 隧道流量 mrmr算法 随机森林
在线阅读 下载PDF
基于气象因素与特征选择的进港航班延误可解释预测研究 被引量:8
17
作者 王维莉 王逸文 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第5期162-171,共10页
航班延误预测对于提高旅客满意度和优化资源配置具有重要意义,然而,预测模型的不可见性限制了其进一步发展。为提高航班延误预测问题的准确性与可解释性,以某机场航线到港航班为例,在考虑机场不同气象因素的基础上,基于mRMR(max-Relevan... 航班延误预测对于提高旅客满意度和优化资源配置具有重要意义,然而,预测模型的不可见性限制了其进一步发展。为提高航班延误预测问题的准确性与可解释性,以某机场航线到港航班为例,在考虑机场不同气象因素的基础上,基于mRMR(max-Relevance and min-Redundancy)算法剔除冗余特征,筛选最优特征子集作为预测模型的输入,在比较多种机器学习算法后,选择Catboost算法,利用SHAP(Shapley Additive Explanation)归因分析方法,从局部解释和全局解释深入挖掘各因素对航班延误时间的不同影响程度,并采用偏依赖分析提取关键因素的最佳阈值。结果表明:经过特征选择后的Catboost预测模型能够更好地捕捉非线性特征,相比于未经过特征选择的模型,MAE(Mean Absolute Error)、RMSE(Root Mean Square Error)及MAPE(Mean Absolute Percentage Error)分别降低了3.84%,3.35%,4.22%,并利用DM(Diebold-Mariano)检验从统计学上检验模型的差异性;同时,航班延误时间受到多种气象特征以及前序延误等因素共同影响,其中,机场风速和降水量对延误时间有显著正向影响,而机场有效风力和能见度则对延误时间有显著负向影响。 展开更多
关键词 航空运输 航班延误预测 SHAP归因分析 进港航班 mrmr算法 Catboost算法
在线阅读 下载PDF
基于联合分类的有效测试模式重选方法 被引量:4
18
作者 詹文法 张鲁萍 江健生 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第3期155-162,共8页
针对目前集成电路测试复杂度的不断增加,导致测试成本不断攀升的问题,提出一种可靠而有效的测试集优化方法。通过k均值(K-means)聚类对原始测试集中的特征进行聚类筛选,然后采用改进的mRMR算法,分段式引入特征之间冗余性权重因子,用以... 针对目前集成电路测试复杂度的不断增加,导致测试成本不断攀升的问题,提出一种可靠而有效的测试集优化方法。通过k均值(K-means)聚类对原始测试集中的特征进行聚类筛选,然后采用改进的mRMR算法,分段式引入特征之间冗余性权重因子,用以权衡特征相关性和冗余性的度量,同时插入了SVM交叉验证,强化了测试模式选择的准确性。在保证故障覆盖率基本不变的情况下,达到减少原始测试集维数的目的。对ISCAS89电路实验表明,该文方法将原始测试集的测试模式进行大量的精简,既保证测试质量,也极大地优化了测试集,进行冗余消除和排序后的测试流程缩短了40.43%的测试时间,提升了测试效率,降低了测试成本。 展开更多
关键词 K均值聚类 原始测试集 改进的mrmr算法 SVM交叉验证
原文传递
基于MPGA的混合特征选择算法在驾驶压力检测中的应用 被引量:2
19
作者 张傲 陈兰岚 魏琛 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期125-132,共8页
针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征... 针对多源生理信号应用于驾驶压力检测中存在信号种类多、特征维数高以及运算效率低的问题,提出了一种结合特征选择(ReliefF)算法、最大相关最小冗余(MRMR)算法和多种群遗传算法(MPGA)的混合特征选择算法。首先利用ReliefF算法计算特征信号的权重值,初选出对分类效果影响显著的特征子集;然后利用MRMR算法去掉冗余的特征,进一步精简特征子集;在此基础上采用MPGA挑选出效果最佳的特征子集。将该算法应用于驾驶压力检测,并与其他类似算法进行了对比。实验结果表明,该算法有效地消除了高维特征中的冗余信息,提高了特征选择阶段的运算效率且达到了很好的分类效果。 展开更多
关键词 生理信号 RELIEFF算法 mrmr算法 MPGA算法 特征选择 驾驶压力检测
在线阅读 下载PDF
基因数据集混合特征选择算法研究 被引量:1
20
作者 马国娟 吴辰文 刘文祎 《测控技术》 2019年第10期71-75,共5页
基因数据的特点是高维度、小样本、大噪声,在处理过程中容易造成维数灾难和过度拟合等问题。针对这种情况提出一种新的基因数据集的特征选择方法,第一步是通过ReliefF算法对基因特征进行权重重要度的筛选;第二步是对筛选过的特征集合进... 基因数据的特点是高维度、小样本、大噪声,在处理过程中容易造成维数灾难和过度拟合等问题。针对这种情况提出一种新的基因数据集的特征选择方法,第一步是通过ReliefF算法对基因特征进行权重重要度的筛选;第二步是对筛选过的特征集合进行mRMR算法判断,留下与目标类别高度相关而其间相关性较小的基因特征;第三步利用邻域粗糙集特征选择算法对简化后的基因数据集进行寻优处理,选出最优化的特征基因子集。为了证明新算法的有效性,以SVM为分类器,使用外部交叉验证法对整个过程来计算,从而验证本文新特征选择方法的有效性。 展开更多
关键词 特征选择 RELIEFF算法 mrmr算法 邻域粗糙集 SVM
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部