期刊文献+
共找到927篇文章
< 1 2 47 >
每页显示 20 50 100
基于改进随机森林算法与多尺度卷积神经网络的频率选择表面敏捷设计
1
作者 王义富 廖广昕 +7 位作者 李华萍 任燕飞 黄浩然 蒋伟 郑沈理 郭嘉诚 杜力 杜源 《通信学报》 北大核心 2026年第1期267-278,共12页
针对传统频率选择表面(FSS)结合神经网络的设计存在预测偏差大、数据集成本高的问题,提出基于改进随机森林(RF)与多尺度卷积神经网络(MS-CNN)的FSS敏捷设计框架。改进RF通过电磁特性分裂准则与多特征交互评估,优化采样策略,构建高质量... 针对传统频率选择表面(FSS)结合神经网络的设计存在预测偏差大、数据集成本高的问题,提出基于改进随机森林(RF)与多尺度卷积神经网络(MS-CNN)的FSS敏捷设计框架。改进RF通过电磁特性分裂准则与多特征交互评估,优化采样策略,构建高质量数据集,达到均方误差(MSE)<2.0的预测精度仅需1157组样本,较传统采样减少61%;MS-CNN采用3×1、5×1、7×1多尺度卷积核提取电磁响应特征,结合频率梯度损失函数,0°/70°入射角下TE/TM双极化S_(21)曲线预测MSE低至2.2。以MS-CNN为预测代理,结合粒子群优化(PSO)的逆向设计,输出满足25~33 GHz频段S_(21)≥-1.5 dB、0°~70°入射角稳定、双极化适配的FSS参数,经HFSS验证达标,同时在20~28 GHz验证了模型泛化性。 展开更多
关键词 频率选择表面 随机森林算法 多尺度卷积神经网络 粒子群优化
在线阅读 下载PDF
基于多线激光雷达的主干形果树树干层级检测方法
2
作者 李秋洁 黄政 《农业机械学报》 北大核心 2026年第2期152-160,264,共10页
针对复杂果园环境行间导航树干检测问题,提出一种基于多线激光雷达(Light detection and ranging,Li DAR)的主干形果树树干层级检测方法,使用16线VLP-16型LiDAR采集车辆周围的果园点云数据,通过目标分割和树干检测2个步骤层次化检测树干... 针对复杂果园环境行间导航树干检测问题,提出一种基于多线激光雷达(Light detection and ranging,Li DAR)的主干形果树树干层级检测方法,使用16线VLP-16型LiDAR采集车辆周围的果园点云数据,通过目标分割和树干检测2个步骤层次化检测树干,去除非树干目标,提高树干检测精度。首先,设置环形感兴趣区域(Region of interest,ROI),采用地面拟合算法移除地面点云,消除果园目标点云之间的连通性;其次,设置矩形ROI,采用基于密度的带噪声空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)算法对非地面点云进行x Oy平面聚类,根据Li DAR测量分辨率和果园目标参数设置DBSCAN算法超参数,将非地面点云分割为若干目标簇;然后,从全局和局部2个尺度提取目标簇的几何和强度特征,用这些特征描述树干与其他果园目标间的差异;最后,采用训练好的树干检测器融合特征,将目标簇划分为树干与非树干2个类别,输出树干簇。树干检测步骤采用随机森林(Random forest,RF)算法进行离线特征选择与融合,使用树干和非树干训练样本,基于基尼指数(Gini index,GI)改变量评价特征重要性,从初始特征中选择22个鉴别力较强的特征,再融合这些特征生成树干检测器。实验场景为标准化种植核桃园,共采集1317帧点云数据,从中分割12213个目标簇,其中,树冠、杂草、支撑杆、围栏、土坡、农具、行人等非树干目标占比58.04%。按照帧比例1∶4将目标簇随机划分为训练集和测试集,测试集树干检测精确率为99.16%、召回率为99.21%、F1分数为99.19%,树干层级检测平均帧耗时85.25 ms。本文方法能对复杂果园场景快速、精准地检测出树干,满足果园行间导航对树干检测的准确性和实时性要求。 展开更多
关键词 果园树干检测 多线激光雷达 DBSCAN 随机森林 特征选择
在线阅读 下载PDF
面向交通强国的研究生生源质量提升路径研究——以哈尔滨工业大学桥梁与隧道工程学科为例
3
作者 高庆飞 王统 +2 位作者 单丽岩 李顺龙 李忠龙 《高等建筑教育》 2026年第1期58-66,共9页
当前,在社会转轨、经济转型与交通变革的新形势下,交通强国建设急需大量德才兼备的国际化拔尖创新人才。然而,随着研究生招生规模的持续扩大与考生择校观念的不断转变,如何精准评价研究生生源质量、吸引更多优质生源是高校当前面临的挑... 当前,在社会转轨、经济转型与交通变革的新形势下,交通强国建设急需大量德才兼备的国际化拔尖创新人才。然而,随着研究生招生规模的持续扩大与考生择校观念的不断转变,如何精准评价研究生生源质量、吸引更多优质生源是高校当前面临的挑战。面向新形势下交通强国建设对一流人才的要求,首先,文章探讨建立以专业能力为导向的多元化生源质量评价体系;其次,从教学科研硬核力、人文资源软实力与未来发展潜力等方面出发,利用随机森林算法深入挖掘影响学生择校的关键要素;再次,基于影响报考指标相对特征重要性,提出多措并举的桥梁与隧道工程学科研究生生源质量提升改革建议;最后,以哈尔滨工业大学桥梁与隧道工程学科为例,从研究生发展路径的视角探讨近五年研究生生源质量提升改革的实践成效,以期为传统交通类院校研究生招生工作提供参考与借鉴。 展开更多
关键词 交通强国 研究生生源质量 提升路径 桥梁与隧道学科 择校动机 随机森林
在线阅读 下载PDF
结合随机抽样和改进Relief-F的高效特征选择算法
4
作者 靳祥 王锋 魏巍 《小型微型计算机系统》 北大核心 2026年第1期34-41,共8页
特征选择是一种常用的数据预处理技术.为更深入分析复杂数据中隐藏的有用信息,本文提出了一种结合随机抽样和改进Relief-F的高效特征选择算法(SSFS).本文中,首先基于Relief-F算法拓展了一种新的计算特征权重的算法MDWA;并将该算法引入... 特征选择是一种常用的数据预处理技术.为更深入分析复杂数据中隐藏的有用信息,本文提出了一种结合随机抽样和改进Relief-F的高效特征选择算法(SSFS).本文中,首先基于Relief-F算法拓展了一种新的计算特征权重的算法MDWA;并将该算法引入到基于耦合学习的特征选择中,设计了一种有效的特征选择算法nFSCL;在此基础上结合随机抽样,并使用随机森林中基于Gini指数的特征重要性评分对所选择到的特征进一步作重要性评价,从而获取到最终的有效特征子集.为验证本文提出新算法的有效性,实验分析中使用了12组UCI数据集作了测试和比较,分别验证了本文拓展的特征权重求解算法MDWA以及高效特征选择算法SSFS的有效性和可行性,进一步表明本文提出的特征选择算法在不同数据集上均能找到有效的特征子集. 展开更多
关键词 特征选择 随机抽样 Relief-F 随机森林
在线阅读 下载PDF
面向地基随遇接入的卫星自主选择测控站方法
5
作者 谢英泽 王淦 +2 位作者 史秀秀 赵笛 窦骄 《航天器工程》 北大核心 2026年第1期45-51,共7页
针对地基随遇接入测控体制下卫星需要在过境时对多个测控站选择接入和切换的问题,从测控站可用仰角和卫星随遇天线可用角度出发,提出一种面向地基随遇接入的卫星自主选择测控站方法。该方法根据预设的天线可用角度、测控站仰角门限等参... 针对地基随遇接入测控体制下卫星需要在过境时对多个测控站选择接入和切换的问题,从测控站可用仰角和卫星随遇天线可用角度出发,提出一种面向地基随遇接入的卫星自主选择测控站方法。该方法根据预设的天线可用角度、测控站仰角门限等参数和其他分系统广播的姿态、轨道等数据,对多个测控站的仰角和随遇天线的俯仰角进行精确计算,最后选择通信质量最优的测控站进行接入和切换。对该方法与选择距离最近测控站方法进行仿真对比,结果表明,该方法能有效选择通信质量最优的测控站,可用于星载地基随遇接入系统。 展开更多
关键词 卫星 地基随遇接入 测控站选择 天线角度
在线阅读 下载PDF
基于特征优选与IPSO-LSTM的变压器故障诊断
6
作者 胡俊泽 杨耿煌 +1 位作者 耿丽清 刘新宇 《电气传动》 2026年第1期89-96,共8页
针对变压器故障诊断精度差、准确率低的问题,提出一种基于数据特征优选与改进粒子群优化算法的长短期记忆网络(IPSO-LSTM)的变压器故障诊断方法。首先对原始数据集进行预处理,使用合成少数类样本过采样技术(SMOTE)扩充数据数量;其次利... 针对变压器故障诊断精度差、准确率低的问题,提出一种基于数据特征优选与改进粒子群优化算法的长短期记忆网络(IPSO-LSTM)的变压器故障诊断方法。首先对原始数据集进行预处理,使用合成少数类样本过采样技术(SMOTE)扩充数据数量;其次利用特征比值法扩充特征维数至20维,使用随机森林(RF)算法判断特征重要程度进行特征优选,降低过拟合风险;然后引入自适应惯性权重对PSO算法进行改进,利用改进后的PSO算法来优化LSTM最优超参数;最后输入特征优选后的数据进行变压器故障诊断。结果表明所构建的故障诊断模型诊断精度为91.6%。该优化模型与LSTM,HBA-LSTM和PSO-LSTM诊断模型相比,准确率分别提高了10.12%,5.95%,3.57%,证明IPSO-LSTM诊断模型有更高的诊断准确率,在变压器故障诊断领域有一定的实际意义。 展开更多
关键词 变压器故障诊断 特征优选 随机森林 长短期记忆网络 粒子群优化算法
在线阅读 下载PDF
基于IV-RF耦合模型与空间约束采样的滑坡易发性评价优化
7
作者 张云 许文浩 +6 位作者 宋国虎 鲁科 罗伟奇 资锋 梁安宁 邓思琪 高俊华 《中国水土保持科学》 北大核心 2026年第1期115-125,共11页
【目的】耒阳市滑坡灾害频发,对人民生命财产和生态安全构成严重威胁。为提高滑坡易发性评价的精度,【方法】以湖南省耒阳市为研究区,构建信息量模型(information value model,IV)与随机森林模型(random forest,RF)耦合的IV-RF模型,引... 【目的】耒阳市滑坡灾害频发,对人民生命财产和生态安全构成严重威胁。为提高滑坡易发性评价的精度,【方法】以湖南省耒阳市为研究区,构建信息量模型(information value model,IV)与随机森林模型(random forest,RF)耦合的IV-RF模型,引入空间约束采样策略优化负样本选取策略,开展滑坡易发性评价。通过ROC曲线和AUC值对3种模型进行对比分析,同时提出综合性能指数用于综合评价模型表现。【结果】1)IV-RF耦合模型表现优于单一模型,AUC=0.952,综合性能指数(Accuracy+F1+MCC)为2.593。极高-高易发区滑坡点分布密集,极低-低易发区滑坡点极少,验证模型具有较高的空间预测精度。2)工程地质岩组因子是影响研究区滑坡发育最重要的评价因子之一。【结论】IV-RF耦合模型结合IV的数据定量解译与RF的非线性识别能力,可有效提升模型识别精度,研究结果可为研究区滑坡灾害风险防控、水土保持和国土空间规划提供科学依据。 展开更多
关键词 负样本选取 随机森林模型 信息量模型 滑坡 易发性评价 空间约束采样 综合性能指标 信息量–随机森林耦合模型 湖南耒阳
在线阅读 下载PDF
道路性能影响因素选择方法研究
8
作者 李毅帆 王维庄 +3 位作者 丁小平 倪静哲 张利维 曹江 《山西建筑》 2026年第1期147-151,共5页
道路性能预测模型在道路养护与管理中发挥着至关重要的作用,然而道路监测数据中包含的影响因素复杂多样,数据规模大、维度高、质量参差不齐,并且影响因素之间存在复杂的非线性关系,评价道路性能影响因素的重要性有助于提高决策模型的有... 道路性能预测模型在道路养护与管理中发挥着至关重要的作用,然而道路监测数据中包含的影响因素复杂多样,数据规模大、维度高、质量参差不齐,并且影响因素之间存在复杂的非线性关系,评价道路性能影响因素的重要性有助于提高决策模型的有效性和可靠性。文中对递归特征消除法进行改进,将道路性能影响因素的筛选流程分成两个阶段:第一阶段基于Spearman系数和随机森林方法进行初筛;第二阶段基于递归消除法进行复筛。研究表明,基于改进递归特征消除法的道路性能影响因素选择方法,降低了模型迭代训练过程中的计算资源消耗,避免了冗余特征的干扰,能够更精确地量化各影响因素与道路性能之间的关联强度,为道路性能的评估提供了更可靠的分析工具。 展开更多
关键词 特征选择 Spearman系数 随机森林 递归特征消除 计算模型
在线阅读 下载PDF
基于PSO-RF的小电流接地系统单相故障选线方法
9
作者 钟灵毓秀 郑吴筱添 +3 位作者 靳玉洁 吴梦宇 钟建伟 廖红华 《电工电气》 2026年第1期45-50,60,共7页
针对配电网小电流接地系统发生单相接地故障时选线过程易受噪声干扰、选线精度较低的问题,提出了一种多判据融合的选线方法。该方法结合快速傅里叶变换(FFT)与变分模态分解(VMD)技术,提取各线路零序电流的三种特征分量,构建多维度输入特... 针对配电网小电流接地系统发生单相接地故障时选线过程易受噪声干扰、选线精度较低的问题,提出了一种多判据融合的选线方法。该方法结合快速傅里叶变换(FFT)与变分模态分解(VMD)技术,提取各线路零序电流的三种特征分量,构建多维度输入特征;在此基础上,引入粒子群算法优化的随机森林分类器(PSO-RF),以故障线路为输出标签对模型进行训练,实现对新故障数据的准确线路判别。利用MATLAB/Simulink软件建立单相接地故障仿真模型进行仿真实验,验证所提方法的有效性,并与现有算法进行对比。结果表明,所提方法在选线准确率方面具有显著优越性,展现出良好的工程应用潜力。 展开更多
关键词 故障选线 小电流接地 粒子群算法 随机森林分类器 多判据融合
在线阅读 下载PDF
协同Sentinel-2和GF-3多特征优选的农作物识别 被引量:3
10
作者 张青松 王金鑫 赫晓慧 《农业工程学报》 北大核心 2025年第4期153-163,共11页
农作物识别是精准农业的重要研究领域。在时空大数据和智能计算时代,如何充分挖掘和综合应用各种数据、方法和模型的优势是提高遥感农作物识别精度的有效途径。该研究以安徽省颍上县为例,采用Sentinel-2和GF-3卫星影像数据,提取了包括... 农作物识别是精准农业的重要研究领域。在时空大数据和智能计算时代,如何充分挖掘和综合应用各种数据、方法和模型的优势是提高遥感农作物识别精度的有效途径。该研究以安徽省颍上县为例,采用Sentinel-2和GF-3卫星影像数据,提取了包括光谱、指数、纹理和极化等在内的58个特征指标;随后分别选取3种特征优选算法和3种机器学习方法进行组合,设计了3种试验方案,探索特征选择和机器学习方法对农作物分类的影响;通过对比特征维度和分类精度,对各种分类方案进行评价。研究结果显示:红边特征在农作物识别中具有重要作用,同时纹理特征的加入也适当提高了分类精度;3种特征优选算法分别和随机森林方法组合时,分类精度均为最优;其中Relief F与随机森林组合在遥感农作物识别分类中效果最好,总体精度达到了93.39%,Kappa系数为0.893 3,F1得分为93.31%;比Relief F结合极限梯度提升和支持向量机分类方法的总体精度、Kappa系数、F1得分分别提高1.36个百分点、0.021和1.31个百分点,8.81个百分点、0.131 2和8.78个百分点;在随机森林分类方法下,Relief F特征选择维度为28维,比随机森林的递归特征消除和卡方检验特征优选算法分别低4和22维,证明了Relief F结合随机森林分类方法的有效性和先进性。该研究为精准农作物识别提供了新的技术思路。 展开更多
关键词 农作物 分类 特征 优选 随机森林 Sentinel-2 GF-3
在线阅读 下载PDF
GEE遥感特征混合优选提升高海拔树种分类精度
11
作者 周赛 黄凯 +5 位作者 张加龙 王明星 滕晨凯 夏乐艳 姜新周 程滔 《北京林业大学学报》 北大核心 2026年第1期26-40,共15页
【目的】高海拔地区森林资源动态监测面临云雾干扰、训练样本匮乏及树种光谱相似性高等多重瓶颈,严重制约了优势树种空间分布的精准制图。本研究以香格里拉市典型纯林为对象,旨在利用多源遥感数据与多策略特征优选方法提升树种识别精度... 【目的】高海拔地区森林资源动态监测面临云雾干扰、训练样本匮乏及树种光谱相似性高等多重瓶颈,严重制约了优势树种空间分布的精准制图。本研究以香格里拉市典型纯林为对象,旨在利用多源遥感数据与多策略特征优选方法提升树种识别精度与模型泛化能力。【方法】研究基于GEE平台获取Sentinel-2光学时序、Sentinel-1雷达数据及SRTM地形数据,提取光谱、纹理、植被指数、雷达极化、地形及时序特征,构建基础特征集。采用随机森林(RF)模型确定特征优选前的最优方案后,并行J-M距离、ReliefF和RFE算法构建单一特征集,同时对这3种特征集进行并集融合构建并行混合特征集。将单一优选与并行混合特征集分别代入RF模型重新分类,对比优选前后方案确定最优分类方案。采用生产者精度(PA)、用户精度(UA)、调和平均值(F1)、总体精度(OA)和Kappa系数评价分类精度。【结果】(1)基于J-M距离、ReliefF和RFE并行混合的特征优选方案9精度最高(OA为94.82%,Kappa系数为0.94),优于特征优选前的最优方案5。(2)多源遥感数据协同分类效果优于单一数据源,仅使用Sentinel-2数据的OA为83.35%(Kappa系数0.79);依次引入Sentinel-1雷达特征、Sentinel-1的纹理特征、地形特征和Sentinel-2时序特征后,OA分别提升了0.87、6.28、8.08、10.18个百分点(Kappa系数分别为0.81、0.86、0.90、0.92),其中Sentinel-2时序特征的引入使分类精度提升了2.10个百分点。(3)植被指数时序曲线分析表明,优势树种在秋冬季节差异显著,可分离性强。【结论】基于GEE平台多源遥感数据协同J-M距离-ReliefF-RFE并行混合特征优选有效提升了香格里拉森林优势树种的识别精度,系统揭示了其空间分布格局,为高海拔地区森林资源的精准监测提供了技术支撑。 展开更多
关键词 树种分类 多源遥感数据 并行混合特征选择 Sentinel-2时序 Google Earth Engine(GEE) 随机森林(RF) 递归特征消除(RFE) J-M距离 香格里拉
在线阅读 下载PDF
激光诱导击穿光谱结合机器学习的土壤沉积物重金属元素定量分析方法研究 被引量:3
12
作者 杏艳 李茂刚 +4 位作者 念娟妮 王婷 周奎 张天龙 李华 《分析测试学报》 北大核心 2025年第6期1115-1122,共8页
土壤沉积物中的重金属污染问题日益凸显,开发现场快速检测技术已成为确保污染监测有效性及推进环境治理不可或缺的手段。基于此,该研究提出了一种基于激光诱导击穿光谱技术(LIBS)结合机器学习算法的土壤沉积物重金属元素定量分析方法。... 土壤沉积物中的重金属污染问题日益凸显,开发现场快速检测技术已成为确保污染监测有效性及推进环境治理不可或缺的手段。基于此,该研究提出了一种基于激光诱导击穿光谱技术(LIBS)结合机器学习算法的土壤沉积物重金属元素定量分析方法。首先,基于搭建的LIBS装置采集了土壤沉积物样本的光谱,探究了不同光谱预处理方法对光谱数据的预处理性能。紧接着基于变量重要性测量(VIM)对预处理后的光谱数据进行特征变量筛选。借助交叉验证对预处理方法、变量重要性阈值等参数进行了优化。基于优化的输入变量建立了土壤沉积物样本中3种重金属元素(Pb、Cu和Zn)的定量分析模型,并与其他校正模型的性能进行了比对。结果表明,该研究提出的VIM-RF校正模型表现出最佳的预测性能,对于Pb其R^(2)_(p)为0.9930,RMSE_(p)为0.0298mg/kg,对于Cu其R^(2)_(p)为0.9810,RMSE_(p)为0.1127mg/kg,对于Zn其R^(2)_(p)为0.9920,RMSE_(p)为0.1662 mg/kg。由此可见,该文建立的方法有望为土壤沉积物环境重金属污染快速筛查及治理提供一定的理论参考依据。 展开更多
关键词 土壤沉积物 重金属 激光诱导击穿光谱 随机森林 特征选择
在线阅读 下载PDF
基于随机森林特征选择与POA-LSTM组合的参考作物腾发量预测方法 被引量:3
13
作者 李越 岳春芳 陈大春 《节水灌溉》 北大核心 2025年第1期120-128,共9页
为了更好地捕捉参考作物腾发量(ET_(0))数据的非线性特点及有效影响因素,实现对气象资料缺乏时的ET_(0)精准预测,基于融合建模思想提出了一种随机森林特征选择与鹈鹕优化算法(POA)优化长短期记忆神经网络(LSTM)组合的ET_(0)预测方法。首... 为了更好地捕捉参考作物腾发量(ET_(0))数据的非线性特点及有效影响因素,实现对气象资料缺乏时的ET_(0)精准预测,基于融合建模思想提出了一种随机森林特征选择与鹈鹕优化算法(POA)优化长短期记忆神经网络(LSTM)组合的ET_(0)预测方法。首先,采用随机森林特征选择方法筛选出有效气象因子作为模型输入;随后,通过POA搜索最优超参数组合用于优化LSTM模型;最后,基于最优超参数下的LSTM模型进行ET_(0)预测。结果表明,POA-LSTM模型整体优于其余模型,其中POA-LSTM1(u_(2)、N、R_(H)、T_(mean))预测精度最高,测试集R^(2)、RMSE和MAE分别为0.927、0.778和0.400 mm/d;POA-LSTM4(u_(2)、N)也能较好地适应少量气象参数估算ET_(0),测试集R^(2)、RMSE和MAE分别为0.881、0.995和0.510 mm/d,相较于其他方法,具有更高的预测精度和稳定性。 展开更多
关键词 参考作物腾发量 长短期记忆神经网络 随机森林 特征选择 鹈鹕优化算法
在线阅读 下载PDF
热连轧精轧板带宽度PCA优化RF算法预测分析
14
作者 杨磊 张明明 王国强 《机械设计与制造》 北大核心 2025年第12期133-136,142,共5页
选择国内某2250mm规格尺寸的热连轧精轧产线进行测试,结合主成分分析(Principal Component Analysis,PCA)和随机森林(Random Forests,RF)方法构建了一种PCA-RF算法来实现热连轧精轧板带宽度预测。把特征选择数据集分成训练与测试集,利... 选择国内某2250mm规格尺寸的热连轧精轧产线进行测试,结合主成分分析(Principal Component Analysis,PCA)和随机森林(Random Forests,RF)方法构建了一种PCA-RF算法来实现热连轧精轧板带宽度预测。把特征选择数据集分成训练与测试集,利用网格搜寻获得最优模型。运用在线检测的方法完成可行性验证,结合MSE、MAPE与拟合决定系数对预测精度进行估计。研究结果表明:主成分数为8下,对应特征值达到1.55,已经超过1,达到85.4%的累计方差贡献率。PCA-RF模型预测误差介于(-10~10)mm之间,达到较低误差。PCA-RF模型达到更高预测精度,表现出更优预测性能。每个道次的样本点R-squared介于(0.999~1),推断模型达到了较高的精度,大幅降低预测偏差,能够满足实时高精度预测带钢尺寸的要求。该研究适用于同类型的板带轧制领域,具有很好应用推广价值。 展开更多
关键词 热连轧精轧 主成分分析 特征选择 宽度预测 随机森林算法
在线阅读 下载PDF
结合混合特征选择和Transformer的网络数据流异常检测 被引量:2
15
作者 向思羽 刘才铭 《电子科技大学学报》 北大核心 2025年第3期442-454,共13页
智能学习方法在网络数据异常分析中发挥着重要作用,但传统智能化异常分析方法难以在网络数据分析结果的可解释性、异常分析的计算资源消耗量、网络数据流序列数据分析准确度上寻得平衡。为克服以上问题,提出了一种结合混合特征选择和Tra... 智能学习方法在网络数据异常分析中发挥着重要作用,但传统智能化异常分析方法难以在网络数据分析结果的可解释性、异常分析的计算资源消耗量、网络数据流序列数据分析准确度上寻得平衡。为克服以上问题,提出了一种结合混合特征选择和Transformer的网络数据流异常检测模型,基于混合特征选择方法进行数据预处理,基于改进的Transformer进行异常检测。采用树模型与互信息的混合特征选择算法对网络数据特征进行降维。采用Transformer的encoder部分作为分类任务的核心,并融入卷积操作来增强对网络数据流序列数据的局部感知能力,通过分类头进行输出。对所提方法进行了仿真实验,在公共入侵检测数据集CICIDS2017上进行验证,实验结果表明,该模型能对网络数据流异常进行有效检测,优于所对比的基于神经网络的入侵检测方法。 展开更多
关键词 混合特征选择 随机森林 互信息 自注意力机制 异常检测
在线阅读 下载PDF
深埋长大隧道地温预测的机器学习算法对比研究 被引量:1
16
作者 周权 罗锋 +1 位作者 柴波 周爱国 《安全与环境工程》 北大核心 2025年第1期137-147,共11页
地热对隧道施工、工程结构及运营安全等均有较大的危害,随着我国基础设施建设布局西移,隧道建设的地质条件愈发复杂,隧道埋深和长度不断增加,隧道施工期高温热害问题频发。针对传统地温预测方法中预测精度不高、数据运用不充分,单一机... 地热对隧道施工、工程结构及运营安全等均有较大的危害,随着我国基础设施建设布局西移,隧道建设的地质条件愈发复杂,隧道埋深和长度不断增加,隧道施工期高温热害问题频发。针对传统地温预测方法中预测精度不高、数据运用不充分,单一机器学习模型解译性差等问题,以A隧道为研究对象,将决策树(decision tree,DT)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)进行耦合,提出了基于DT-SVM-RF模型的深埋长大隧道地温预测方法。在分析隧道综合测井、地应力及岩石热物理试验、航空物探数据后,选取深度、声波波速等10个影响因子作为模型的输入,采用随机交叉验证和空间交叉验证对模型的鲁棒性、泛化能力进行检验,构建LASSO回归、随机森林、互信息3种回归模型,分析10个影响因子的特征重要性排序。结果表明:在测试集上多元线性回归、支持向量机、人工神经网络和决策树-支持向量机-随机森林(decision tree-support vector machinerandom forest,DT-SVM-RF)模型决定系数(R^(2))分别为0.76、0.91、0.88、0.93,均方误差MSE分别为17.64、6.25、8.46、5.20,DT-SVM-RF模型具有相对更优的预测性能,深度、岩石导温系数、岩石导热系数、最大水平主应力特征较为重要,说明DT-SVM-RF模型能有效地提高地温预测的准确率。研究结果可为类似隧道地温预测提供一种精度更高的可行新思路。 展开更多
关键词 隧道热害 隧道安全 多元线性回归 支持向量机(SVM) 随机森林(RF) 人工神经网络(ANN) 特征选择
在线阅读 下载PDF
基于关键特征的制冷剂泄漏故障软测量研究 被引量:2
17
作者 凌敏彬 杨钰婷 +2 位作者 韩华 徐玲 崔晓钰 《制冷学报》 北大核心 2025年第2期145-154,共10页
针对制冷剂泄漏难以直接测量的问题,建立基于数据挖掘和关键特征的制冷剂泄漏故障软测量研究。通过随机森林重要性排序和距离相关系数对制冷剂泄漏故障的表征特征进行筛选,建立支持向量回归(SVR)软测量模型对泄漏进行定量测量。经一台... 针对制冷剂泄漏难以直接测量的问题,建立基于数据挖掘和关键特征的制冷剂泄漏故障软测量研究。通过随机森林重要性排序和距离相关系数对制冷剂泄漏故障的表征特征进行筛选,建立支持向量回归(SVR)软测量模型对泄漏进行定量测量。经一台额定制冷量为1440 kW、充注量为330 kg螺杆式冷水机组泄漏实验验证,基于3个表征特征建立的SVR软测量模型在测试集上的均方根误差(RMSE)和平均绝对误差(MAE)分别为0.844 kg和0.734 kg,软测量性能较其它3个特征子集显著提升。 展开更多
关键词 制冷剂泄漏 特征选择 软测量 随机森林 支持向量回归
在线阅读 下载PDF
适应拓扑变化的数据驱动电力系统暂态主导失稳模式识别方法 被引量:1
18
作者 周芮 杨燕 +4 位作者 余娟 杨知方 朱晟毅 余亚南 孙昕炜 《中国电机工程学报》 北大核心 2025年第9期3436-3447,I0013,共13页
电力系统暂态电压与功角混合失稳下的主导失稳模式(dominant instability mode,DIM)识别对制定快速调整措施至关重要。然而,现有数据驱动方法因拓扑变化适应能力不足,导致识别精度下降甚至失效。由此,该文提出一种适应拓扑变化的数据驱... 电力系统暂态电压与功角混合失稳下的主导失稳模式(dominant instability mode,DIM)识别对制定快速调整措施至关重要。然而,现有数据驱动方法因拓扑变化适应能力不足,导致识别精度下降甚至失效。由此,该文提出一种适应拓扑变化的数据驱动DIM识别方法。首先,提出基于K-means聚类和多随机卷积核变换的DIM高精度智能识别基础模型,利用K-means自适应选取关键暂态曲线,基于多随机卷积核变换表征暂态曲线斜率、失稳持续时间等重要DIM判断特征,从而适应拓扑变化并高效提取暂态曲线时序特征。其次,针对单个基础模型输出不确定性、可信度不足问题,提出基于Bagging集成学习和误差-分歧分解理论的DIM智能识别框架,自适应最优选择多个基础模型共同决策,提高结果的稳定性和可信性。最后,在中国电力科学研究院有限公司36节点系统及其修改系统、某实际电网8897节点系统上的算例分析表明,所提方法可在保证较高DIM识别精度的情况下适应拓扑变化,验证了方法的有效性。 展开更多
关键词 暂态稳定 主导失稳模式 关键曲线选取 多随机卷积核变换 集成学习
原文传递
基于随机森林算法的贺兰山东麓洪积扇微地形分类研究 被引量:2
19
作者 李红霞 石云 +9 位作者 沈爱红 马益婷 梁咏亮 李晓娟 董军 赵娜 佘洁 王彤 张风红 郭瑞 《第四纪研究》 北大核心 2025年第1期178-190,共13页
微地形影响水热分布,形成不同的表面砾石、灌木、草本等组成分布特征,提取洪积扇微地形,构建洪积扇区微地形数字分类体系,可以为洪积扇地区土壤水热空间异质性、植物群落的空间分布、水源涵养能力以及土地利用分析提供依据。本研究以贺... 微地形影响水热分布,形成不同的表面砾石、灌木、草本等组成分布特征,提取洪积扇微地形,构建洪积扇区微地形数字分类体系,可以为洪积扇地区土壤水热空间异质性、植物群落的空间分布、水源涵养能力以及土地利用分析提供依据。本研究以贺兰山东麓洪积扇为研究区,根据其地表形态、相对高差、砾石粒径大小以及植被组成,将洪积扇划分为冲积台地、高漫滩、冲沟、槽滩等4种微地形分类体系;以高精度DEM数据和无人机遥感影像为数据源,应用面向对象技术与数字地形分析结合的微地形识别与分类的方法,提取微地形的光谱、地形、纹理、几何等特征信息,通过影像分割、特征优选、随机森林(RF)分类算法,对贺兰山东麓洪积扇微地形进行识别分类,并验证分类精度。结果表明:1)融合地形特征的微地形面向对象分类的最优分割尺度为35;2)光谱特征和地形特征在贺兰山洪积扇微地形分类时重要性程度高,对微地形识别贡献度大;3)RF对微地形识别分类的效果最佳,总体精度为89.17%, Kappa系数为0.8480;4)微地形空间分布以高漫滩为主,广泛分布于洪积扇顶部,面积0.1224 km^(2),约占整个研究区总面积51.09%,冲积台地和槽滩的面积为0.0484 km^(2)、 0.0528 km^(2),分别占总面积的20.24%、 22.23%;冲沟分布最少,仅占总面积6.42%。总体上微地形的空间格局呈现地形类别之间交叉镶嵌分布特征。研究结果可以用于分析贺兰山洪积扇地区的微地形空间分布格局差异,为荒漠草原生态系统中地形复杂地区的洪积扇生态本底环境监测与水源涵养提供科学依据,对贺兰山东麓洪积扇生态系统的合理利用与科学管理具有重要意义。 展开更多
关键词 洪积扇 微地形 随机森林 数字地形分析 特征优选
原文传递
基于实验室数据的卵巢恶性肿瘤机器学习诊断模型 被引量:1
20
作者 程晓冉 赵丹 牛承志 《国际妇产科学杂志》 2025年第4期431-438,共8页
目的:探讨基于多种实验室检测指标构建的人工智能模型用于卵巢恶性肿瘤诊断的临床应用价值。方法:回顾性分析郑州大学第一附属医院收集的3465例卵巢恶性肿瘤和6987例卵巢良性肿瘤患者的实验室检测数据,将患者按7∶3随机分为训练集(7317... 目的:探讨基于多种实验室检测指标构建的人工智能模型用于卵巢恶性肿瘤诊断的临床应用价值。方法:回顾性分析郑州大学第一附属医院收集的3465例卵巢恶性肿瘤和6987例卵巢良性肿瘤患者的实验室检测数据,将患者按7∶3随机分为训练集(7317例)和测试集(3135例),采用Boruta特征选择法和Lasso回归法进行特征筛选,构建随机森林、逻辑回归、支持向量机和梯度提升决策树模型,并通过曲线下面积(area under the curve,AUC)、准确率、精确率、召回率和F1分数综合评估模型效能。结果:随机森林模型在测试集中表现最佳,AUC为0.924,准确率为0.872,召回率为0.749,优于其余3种模型及常用单一指标[人附睾蛋白4(human epididymis protein 4,HE4)、糖类抗原125(carbohydrate antigen 125,CA125)、CA15-3和D-二聚体]。特征重要性分析显示,HE4、CA15-3、CA19-9、CA125、CA724、甲胎蛋白、D-二聚体、纤维蛋白原、白蛋白、乳酸脱氢酶、中性粒细胞百分比、中性粒细胞绝对值、淋巴细胞百分比、淋巴细胞绝对值和血小板计数15项指标在模型中贡献显著,提示其在临床诊断中具有重要价值。结论:基于实验室检测数据构建的随机森林模型在诊断卵巢恶性肿瘤中表现出较高效能,具备良好的临床应用潜力。未来可进一步结合多中心数据和多模态信息,不断提升模型的泛化能力与临床可解释性,推动其在实际诊疗中的深化应用。 展开更多
关键词 卵巢肿瘤 诊断 人工智能 机器学习 实验室检测指标 随机森林 特征选择
暂未订购
上一页 1 2 47 下一页 到第
使用帮助 返回顶部