期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于RF-PCA-改进SVM模型的齿轮故障诊断方法 被引量:3
1
作者 陈立爱 汪佳奇 +1 位作者 陈松 王大桂 《测控技术》 2023年第8期15-21,共7页
为提升齿轮故障诊断的正确率,提出了基于随机森林(Random Forest,RF)和主成分分析法(Principal Components Analysis,PCA)对齿轮振动信号进行特征降维处理,并采用粒子群算法(Particle Swarm Optimization,PSO)求解支持向量机(Support Ve... 为提升齿轮故障诊断的正确率,提出了基于随机森林(Random Forest,RF)和主成分分析法(Principal Components Analysis,PCA)对齿轮振动信号进行特征降维处理,并采用粒子群算法(Particle Swarm Optimization,PSO)求解支持向量机(Support Vector Machine,SVM)特征参数最佳取值的齿轮故障诊断模型(RF-PCA-改进SVM模型)。对齿轮箱实例中正常、断齿、齿根开裂、剥落、削尖等9种不同状态进行了验证,证明了RF-PCA-改进SVM模型对齿轮故障诊断的有效性。试验结果表明:通过对比不同诊断模型识别率,证明RF-PCA-改进SVM模型具有更优的齿轮故障识别率,平均达到了99.66%,且计算效率较高;样本数量改变虽然会影响模型正确识别率,但不同的改变方式对识别率影响的程度不同,对于RF-PCA-改进SVM模型,当齿轮状态数据大于40个时即可达到88%以上的正确识别率。 展开更多
关键词 齿轮箱 故障诊断 RF PCA 改进SVM
在线阅读 下载PDF
SMOTE-PCA-RF模型:FY-3D卫星微波湿度计亮温降雨反演方法
2
作者 毛颖 潘卫华 +1 位作者 李丽纯 翁升恒 《地球信息科学学报》 北大核心 2025年第7期1656-1670,共15页
【目的】降雨监测对于防御气象灾害、保护生态环境以及科学管理水资源等具有重要意义。现有研究在利用机器学习算法反演降雨时,出现将类别不均衡或随机过、欠采样等数据作为模型输入特征的情况,存在特征间包含相关性较高的因子,易削弱... 【目的】降雨监测对于防御气象灾害、保护生态环境以及科学管理水资源等具有重要意义。现有研究在利用机器学习算法反演降雨时,出现将类别不均衡或随机过、欠采样等数据作为模型输入特征的情况,存在特征间包含相关性较高的因子,易削弱模型精度与泛化能力等问题,本文提出一种新的融合机器学习和卫星遥感资料的降雨监测模型。【方法】该方法利用福建省2020—2022年14次主要降雨过程中实测雨量数据和FY-3D卫星微波温湿度计融合产品(Microwave Temperature Sounder/Microwave Humidity Sounder,TSHS)中的微波湿度计(Microwave Humidity Sounder,MWHS)亮温资料,提出基于合成少数类过采样(Synthetic Minority Over-sampling Technique,SMOTE)与主成分分析(Principal Component Analysis,PCA)法,通过随机森林(Random Forest,RF)分类器构建SMOTE-PCA-RF小时级监测模型,实现福建省降雨落区识别与等级划分,并与RF、PCA-RF、SMOTE-RF的反演结果进行对比,从中筛选出最优模型。【结果】SMOTE-PCA-RF模型在降雨落区反演的测试风险评分(Threat Score,TS)和等级划分反演的测试调和平均值(F1)均为0.60,表现最优,且相较于其他模型,TS值提高3.45%~9.09%,F1值提高9.09%~33.33%。此外,研究发现SMOTE法虽能提升模型的分类性能,但会加剧过拟合现象与空报率(False Alarm Rate,FAR);而PCA法通过数据降维不仅能提高模型泛化能力,还将训练时效提升9.75%~31.70%。基于SMOTE-PCA-RF模型的个例分析表明,随着降雨量增加导致反演精度有所降低,但测试F1值达0.50,反演结果与实测雨况空间分布具有较高一致性。【结论】研究可为降雨监测提供技术支撑,有助于相关部门快速且直观了解大尺度范围内降雨落区及强度划分的空间分布变化,进一步提升气象防灾减灾能力。 展开更多
关键词 降雨监测 FY-3D卫星 微波湿度计亮温 SMOTE-PCA-RF模型 福建省
原文传递
基于PCA-RF的城轨造价预测研究
3
作者 陈晖扬 汝云翔 《建筑经济》 2025年第S1期173-177,共5页
工程造价预测是城轨建设中重要的工作,准确地预测工程造价对于前期的投资决策具有重要的现实意义。为提高准确度,本研究旨在构建基于主成分分析(PCA)与随机森林(RF)的城轨造价预测模型。以PCA降维后的10个影响因素作为输入变量,总工程... 工程造价预测是城轨建设中重要的工作,准确地预测工程造价对于前期的投资决策具有重要的现实意义。为提高准确度,本研究旨在构建基于主成分分析(PCA)与随机森林(RF)的城轨造价预测模型。以PCA降维后的10个影响因素作为输入变量,总工程造价作为输出变量,通过对预测结果的指标评估得出PCA-RF模型具有良好的预测性能。在此基础上,通过添加高斯噪声与传统RF模型、BP神经网络模型作对比,得到PCA-RF模型预测能力显著优于RF、BP,且在中、低噪声下,具有良好的抗干扰能力。 展开更多
关键词 城轨 工程造价 主成分分析 随机森林
在线阅读 下载PDF
PCA+GWO集成特征选择和模型堆叠的客户流失预测
4
作者 刘梅 郑立君 +1 位作者 段永良 段红秀 《计算机工程与应用》 北大核心 2025年第15期329-342,共14页
客户的长期稳定对酒店营收和提高竞争力具有重要意义。在客户流失预测研究中,生产环境采集的数据存在数据量大、维度高、噪点多等问题,导致机器模型的准确率、稳定性和泛化能力下降。针对此类问题,设计了基于PCA+GWO的集成特征选择方法... 客户的长期稳定对酒店营收和提高竞争力具有重要意义。在客户流失预测研究中,生产环境采集的数据存在数据量大、维度高、噪点多等问题,导致机器模型的准确率、稳定性和泛化能力下降。针对此类问题,设计了基于PCA+GWO的集成特征选择方法,并用模型堆叠构建了客户流失预测模型。提出了利用Pearson系数和随机森林(RF)的特征重要性来确定需要降维特征组的方法。改进了灰狼优化算法(GWO)中的灰狼位置更新机制和收敛条件,并将其应用于选择最佳特征子集的过程中。选取了10种不同的机器学习模型进行训练,挑选出F1-score表现最优的模型作为基模型,进行元模型训练。实验结果表明,使用某酒店客户信息数据集时,改进后的GWO算法收敛速度显著提升,且预测模型的F1-score达到了97.9%,该模型具有较强的泛化能力。 展开更多
关键词 特征选择 随机森林(RF) 主成分分析(PCA) 灰狼优化(GWO)算法 模型堆叠
在线阅读 下载PDF
基于PCA和随机森林的医院分诊模型研究
5
作者 李璇 《中国医疗设备》 2025年第8期38-42,76,共6页
目的为解决传统分诊方法分诊效率不高,分诊不准确及隐私泄露的问题,建立一种智能分诊模型,以提高分诊的效率、准确度和隐私保护能力。方法研究融合主成分分析法和随机森林算法设计分诊算法,并引入差分隐私和同态加密技术,构建出一种双... 目的为解决传统分诊方法分诊效率不高,分诊不准确及隐私泄露的问题,建立一种智能分诊模型,以提高分诊的效率、准确度和隐私保护能力。方法研究融合主成分分析法和随机森林算法设计分诊算法,并引入差分隐私和同态加密技术,构建出一种双重加密的医院急诊分诊模型。结果研究设计的分诊算法在2个数据集测试中,分别在第4、17次迭代后完成收敛,拟合度分别为96.8%、98.4%,计算效率和分诊准确度方面均优于其他算法。研究模型的平均计算时间为0.43 s,分诊准确度在隐私保护总预算取值为0.01~5.00的区间内分诊准确度均高于其他分诊模型。应用急诊分诊模型前后就诊等待时间、分诊准确度、再入院率差异均有统计学意义(P<0.05),表明本研究模型明显提高了医院的分诊能力。结论在保障患者隐私的情况下,本研究模型可以高效准确地完成分诊,提高医疗资源的利用率。 展开更多
关键词 主成分分析法 随机森林(RF) 分诊模型 差分隐私(DP) 同态加密(HE) 隐私泄露
暂未订购
基于随机森林和长短期记忆网络模型的高压气井环空带压预测方法 被引量:7
6
作者 张智 王翔辉 +1 位作者 黄媚 冯少波 《天然气工业》 EI CAS CSCD 北大核心 2024年第9期167-178,共12页
高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响... 高压气井在生产过程中持续的环空带压容易引起套管柱变形或挤毁,是高压气井完整性失效的主要原因之一。为解决传统方法环空带压预测精度不高的问题,以鄂尔多斯盆地苏里格气田某高压气井为例,首先利用主成分分析法和相关系数法找到影响环空带压的主要因素,然后使用高压气井井筒温压场理论值和孤立森林模型对主成分进行物理解释和数据清洗,再对清洗后的数据使用随机森林(RF)和长短期记忆网络(LSTM)模型建立了环空带压定量预测模型,并对两类模型进行权重组合,最终建立了精确度高于任意单一模型的RF—LSTM组合环空带压预测新模型。研究结果表明:(1)环空带压的主要影响因子有温度分量、压力分量、产量分量、腐蚀程度、生产状态,而温度分量与环空带压间存在最高关联性;(2)通过错误格式、离群点及基于井筒温压场的数据清洗,可以得到数据清洗后的环空带压影响因素训练集;(3)通过平均绝对误差法(MAE)能够建立误差分数小于任意单一模型,而拟合优度介于两者之间的组合模型,因此可以将具有高拟合优度和低误差分数的两类模型结合,从而组合出同时满足两种分数的组合模型。结论认为:(1)运用大数据挖掘技术及算法进行环空带压定量预测,方法新颖,预测精度高,结果可行;(2)该方法为现场环空带压预测和风险管控提供了决策工具参考,为实现环空带压风险实时预测、预警和管控提供了理论支撑。 展开更多
关键词 环空带压 数据挖掘 随机森林 主成分分析 LSTM 大数据 预测方法
在线阅读 下载PDF
基于鲁棒纹理特征的环境声音事件检测方法 被引量:1
7
作者 吴婷 刘琼 郭慧茹 《电子器件》 CAS 2024年第2期530-535,共6页
针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特... 针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特征维度过高问题,先利用随机森林算法后结合主成分分析(PCA)算法,提出了RF-PCA降维方法;最后使用支持向量机(SVM)对不同环境的声音进行分类。在公开数据集ESC-10上的仿真实验结果表明,利用所提出的基于鲁棒纹理特征的环境声音事件检测方法所提取的特征对声音分类可达到93.00%的分类效果。 展开更多
关键词 环境声音分类 类伽马声谱图 SHEARLET变换 CBP算法 rf-pca
在线阅读 下载PDF
小断面土石组合地质条件下TBM施工围岩可掘性分级识别 被引量:1
8
作者 杨耀红 刘德福 +2 位作者 张智晓 韩兴忠 孙小虎 《长江科学院院报》 CSCD 北大核心 2024年第3期79-87,共9页
围岩可掘性分级以及识别研究对隧道掘进机(TBM)高效率施工及智能化控制意义重大。依托南水北调安阳市西部调水工程TBM施工实际数据,利用掘进性能综合指标单位贯入度推力(FPI)、单位贯入度扭矩(TPI)建立了小断面土石组合地质条件下TBM施... 围岩可掘性分级以及识别研究对隧道掘进机(TBM)高效率施工及智能化控制意义重大。依托南水北调安阳市西部调水工程TBM施工实际数据,利用掘进性能综合指标单位贯入度推力(FPI)、单位贯入度扭矩(TPI)建立了小断面土石组合地质条件下TBM施工围岩可掘性分级标准;提出了PCA-RF模型对围岩可掘性分级进行识别,并与BP、SVR和RF模型进行了比较讨论。结果表明:①建立的小断面土石组合围岩TBM施工可掘性分级标准是适用的,克服了土石组合围岩下传统围岩分类方法的局限性;②小断面土石组合围岩TBM施工可掘性分级PCA-RF识别模型的识别准确率达到了98.3%,高于BP、SVR和RF模型,可以满足工程施工需要。 展开更多
关键词 隧道掘进机(TBM) 小断面 土石组合 可掘性分级 PCA-RF模型
在线阅读 下载PDF
基于PCA-GA-RF的矿井突水水源快速识别模型 被引量:3
9
作者 肖观红 鲁海峰 《煤矿安全》 CAS 北大核心 2024年第6期184-191,共8页
矿井突水已成为影响矿山安全生产的主要危害之一,快速准确识别突水水源类型是矿井突水灾害治理的关键步骤。提出了1种基于PCA-GA-RF的矿井突水水源识别模型;基于安徽省颍上县谢桥煤矿的88组水样实测数据,遵循分层随机抽样的原则,按照7∶... 矿井突水已成为影响矿山安全生产的主要危害之一,快速准确识别突水水源类型是矿井突水灾害治理的关键步骤。提出了1种基于PCA-GA-RF的矿井突水水源识别模型;基于安徽省颍上县谢桥煤矿的88组水样实测数据,遵循分层随机抽样的原则,按照7∶3的比例将其分为62组训练样本和26组预测样本,经PCA提取4个主成分,构建PCA-GA-RF模型,并与PCA-RF、PCA-ABC-RF和PCA-FA-RF模型对比。结果表明:PCA-GA-RF模型判别结果准确率为96.153 8%,与其他模型相比准确率、精确率、召回率和F1值(精确召回率)最高,具有优越性。 展开更多
关键词 矿井突水 水源识别 主成分分析(PCA) 随机森林(RF) 遗传算法(GA)
在线阅读 下载PDF
基于PCA-RF组合模型的福建省空气负氧离子浓度预测研究 被引量:1
10
作者 彭继达 张春桂 《能源与环保》 2024年第1期17-24,共8页
空气负氧离子(NOI)浓度是评价空气新鲜和清洁程度的重要指标。为了提高NOI浓度的监测能力,综合考虑气象要素和遥感因子,分析NOI浓度的关键影响因子,利用皮尔逊相关分析、PCA分析和随机森林机器学习方法(RF)构建了福建区域NOI浓度的PCA-R... 空气负氧离子(NOI)浓度是评价空气新鲜和清洁程度的重要指标。为了提高NOI浓度的监测能力,综合考虑气象要素和遥感因子,分析NOI浓度的关键影响因子,利用皮尔逊相关分析、PCA分析和随机森林机器学习方法(RF)构建了福建区域NOI浓度的PCA-RF预测模型。研究发现,(1)NOI浓度分布与风速(W_(air))、空气温度(T_(air))、大气压强(P_(air))、能见度(I_(VIS))、气溶胶光学厚度(h_(AOD))、植被指数(I_(NDVI))、湿度指数1(I_(NDMI1))、植被供水指数(I_(VSWI))和亮度指数(I_(NDSI))呈显著相关(均通过0.01显著性检验),其中W_(air)、I_(VIS)、I_(NDVI)和I_(VSWI)与NOI浓度呈正相关,T_(air)、P_(air)、h_(AOD)、I_(NDMI1)和I_(NDSI)与NOI浓度呈负相关。(2)主成分数量为7时,方差累计贡献率达到93.36%,能够代表所有因子的大部分信息。(3)PCA-RF模型最佳的ntree和mtry分别为400和7。对福建区域NOI浓度影响较大的前3个因子依次为P_(air)、I_(VIS)和I_(VSWI)。(4)PCA-RF模型在验证集上的RMSE为803.73 ions/cm^(3),R^(2)为0.44,MAE为548.79 ions/cm^(3)。 展开更多
关键词 空气负氧离子 气象因子 遥感因子 PCA-RF 预测模型
在线阅读 下载PDF
基于聚类与降维优化的随机森林算法应用研究
11
作者 张辉 刘皖婷 《黄山学院学报》 2024年第5期44-47,共4页
为帮助学生合理规划考研路径,解决考研人数逐年增加而实际录取率却下降的问题,利用机器学习算法对原始成绩数据进行筛选、预处理和归一化。采用K-Means聚类算法以减少输入预测模型的数据量并提高样本的质量。此外,通过应用主成分分析(Pr... 为帮助学生合理规划考研路径,解决考研人数逐年增加而实际录取率却下降的问题,利用机器学习算法对原始成绩数据进行筛选、预处理和归一化。采用K-Means聚类算法以减少输入预测模型的数据量并提高样本的质量。此外,通过应用主成分分析(Principal Component Analysis,PCA)方法进行降维处理,有效减少数据集中的干扰噪声,提高计算效率。同时帮助减少预测模型训练过程中的过拟合现象,实现数据集特征数量的有效减少。最后,采用随机森林(Random Forest,RF)算法得出预测结果,进而开发一种融合K-Means聚类、主成分分析和随机森林算法的综合预测模型。结果表明,该预测模型的准确率能够达到86.5%以上,为学生考研学习提供了较高的参考价值。 展开更多
关键词 机器学习 K-MEANS 主成分分析法 随机森林算法
在线阅读 下载PDF
高维特征选择方法在近红外光谱分类中的应用 被引量:18
12
作者 秦玉华 丁香乾 宫会丽 《红外与激光工程》 EI CSCD 北大核心 2013年第5期1355-1359,共5页
针对卷烟近红外光谱高噪和高冗余特点,提出了一种基于随机森林(RF)和主成分分析(PCA)的特征优选方法 RF-PCA,建立了5种不同质量级别卷烟的分类模型,并和其他方法进行了比较。该方法能够有效地对高维数据样本进行分类,用于甄别卷烟品质... 针对卷烟近红外光谱高噪和高冗余特点,提出了一种基于随机森林(RF)和主成分分析(PCA)的特征优选方法 RF-PCA,建立了5种不同质量级别卷烟的分类模型,并和其他方法进行了比较。该方法能够有效地对高维数据样本进行分类,用于甄别卷烟品质真伪。特征选择可以过滤与分类不相关的特征,而通过PCA方法可以消除冗余特征的不良影响,并可进一步降低特征维数。实验表明:RF-PCA方法能有效地剔除近红外光谱数据中的噪声特征和冗余特征,提高了分类效率。 展开更多
关键词 近红外光谱 特征选择 随机森林 主成分分析 卷烟
原文传递
基于Adaptive Lasso与RF的航班运行风险预测改进研究 被引量:3
13
作者 王岩韬 陈冠铭 +2 位作者 刘毓 杨远浩 赵航 《交通运输系统工程与信息》 EI CSCD 北大核心 2018年第4期194-201,共8页
为了解决航班运行风险高维数组运算过于复杂的问题,同时为防止模型过度拟合影响预测精度,基于中国民航局发布的风险评估体系,以某航450组真实航班数据为标准样本,首先使用自适应套索算法(Adaptive Lasso)进行降维,从63项风险自变量中筛... 为了解决航班运行风险高维数组运算过于复杂的问题,同时为防止模型过度拟合影响预测精度,基于中国民航局发布的风险评估体系,以某航450组真实航班数据为标准样本,首先使用自适应套索算法(Adaptive Lasso)进行降维,从63项风险自变量中筛选出15项独立变量;然后,使用随机森林算法(Random Forest,RF)进行防过拟合处理,结果显示当使用重要度排序前12项变量拟合时,结果误差达到最小值,即得到最终预测指标;最后,构建Adaptive Lasso和RF的二阶段混合模型,同时选取主成分分析(Principal Component Analysis,PCA)、径向基函数(Radial Basis Function,RBF)网络、支持向量机(Support Vector Machine,SVM)3种对比方法,使用十折交叉验证精度.结果表明:Adaptive Lasso方法在筛选掉48项指标后,结果精度未见下降;经RF处理后4种方法评估精度均大于未处理前;Adaptive Lasso-RF混合模型的预测准确率和稳定性均优于PCA、RBF神经网络和SVM等方法.综上说明混合模型实现了有效降维和防过拟合,可大幅提升预测精度,用于解决航班风险预测问题可行并有效. 展开更多
关键词 航空运输 航班运行风险 自适应套索 随机森林 主成分分析 径向基函数 支持向量机
在线阅读 下载PDF
路堑开挖爆破对民房危害的随机森林预测模型 被引量:3
14
作者 李辉 冯东梅 马寒 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2015年第12期1408-1413,共6页
为研究路堑开挖爆破对邻近民房安全的危害,运用主成分分析及随机森林算法对其进行预测.选取爆破参数、地质条件、民房结构3个方面的共16项重要影响因素,采用主成分分析法并从中提取6个主要成分.以主成分值为输入,房屋安全程度的量化值... 为研究路堑开挖爆破对邻近民房安全的危害,运用主成分分析及随机森林算法对其进行预测.选取爆破参数、地质条件、民房结构3个方面的共16项重要影响因素,采用主成分分析法并从中提取6个主要成分.以主成分值为输入,房屋安全程度的量化值为输出,建立路堑开挖爆破对邻近民房安全危害的随机森林预测模型.利用18组工程实例数据为训练样本,另外4组数据为检验样本,进行了模型的预测实验.实验结果表明:基于主成分分析的随机森林模型对数据的拟合度较高,预测误差低,该模型可以作为实现路堑开挖爆破对邻近民房安全危害预测的一个有效方法. 展开更多
关键词 路堑开挖 爆破震动 民房安全 危害预测 主成分分析 随机森林
原文传递
基于SCADA数据的风电机组齿轮箱状态监测方法 被引量:22
15
作者 尹诗 侯国莲 +2 位作者 于晓东 王其乐 弓林娟 《太阳能学报》 EI CAS CSCD 北大核心 2021年第1期324-332,共9页
为解决故障劣化渐变过程的长时间序列对齿轮箱状态监测模型的影响问题,提升其决策精度,提出一种基于数据采集与监控(SCADA)数据的组合建模方法。首先,采用主成分分析法(PCA)选取与齿轮箱温度密切相关的输入观测向量,并应用长短期记忆(LS... 为解决故障劣化渐变过程的长时间序列对齿轮箱状态监测模型的影响问题,提升其决策精度,提出一种基于数据采集与监控(SCADA)数据的组合建模方法。首先,采用主成分分析法(PCA)选取与齿轮箱温度密切相关的输入观测向量,并应用长短期记忆(LSTM)神经网络分别对齿轮箱正常工况和异常工况独立建立温度模型;其次,结合模型输出结果与SCADA数据提取残差分布特征向量,建立随机森林残差分布模型对机组齿轮箱运行状态进行监测;最后,对某大型风电场机组进行模型建立和仿真研究。结果表明,基于LSTM神经网络结合随机森林算法对风电机组齿轮箱状态监测有较强的实用性和较高的准确率,为后续开展齿轮箱健康度评价提供了新的方法和思路。 展开更多
关键词 风电机组 状态监测 长短期记忆神经网络 主成分分析 随机森林 齿轮箱
原文传递
基于主成分分析协同随机森林算法的热连轧带钢宽度预测 被引量:29
16
作者 丁敬国 郭锦华 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第9期1268-1274,1289,共8页
为提高热连轧粗轧带钢生产过程中换钢种、换规格及换辊后的首块带钢宽度设定模型精度,本文提出一种基于主成分分析协同随机森林(PCA-RF)算法的宽度预测模型.采用主成分分析法对数据样本合理分析,通过计算特征值、主成分贡献度及累计贡... 为提高热连轧粗轧带钢生产过程中换钢种、换规格及换辊后的首块带钢宽度设定模型精度,本文提出一种基于主成分分析协同随机森林(PCA-RF)算法的宽度预测模型.采用主成分分析法对数据样本合理分析,通过计算特征值、主成分贡献度及累计贡献度进行特征选择.在PCA筛选的变量数据集上训练最佳随机森林宽度预测模型.同时,使用支持向量机回归(SVR)、K-最近邻(KNN)模型进行对比验证.通过实际应用表明,PCA-RF各道次宽度模型R-squared值控制在99.9%~1,且96%以上样本点预测误差在-5~5 mm,从而证明该模型实现了换钢种、换规格及换辊后的首块钢宽度的高精度预测. 展开更多
关键词 热连轧粗轧 主成分分析 特征选择 宽度预测 随机森林算法
在线阅读 下载PDF
基于PCA-RF直流炉中间点温度预测控制 被引量:2
17
作者 梁伟平 鲍鹏凯 《仪器仪表用户》 2021年第7期86-89,79,共5页
针对直流炉中间点温度难预测的问题,提出了一种基于PCA(主成分分析)-RF(随机森林)的直流锅炉中间点温度预测的方法。基于某电厂的一段DCS系统运行数据,通过数据预处理采集到与之相关的8个因素,以预测的相对误差为评价指标,构建了PCA-RF... 针对直流炉中间点温度难预测的问题,提出了一种基于PCA(主成分分析)-RF(随机森林)的直流锅炉中间点温度预测的方法。基于某电厂的一段DCS系统运行数据,通过数据预处理采集到与之相关的8个因素,以预测的相对误差为评价指标,构建了PCA-RF预测模型,预测了直流锅炉中间点温度,同时与其它预测模型的仿真曲线对比,结果表明该模型的预测精度高一些,对于中间点温度的预测具有一定的有效性。 展开更多
关键词 直流锅炉 中间点温度 PCA(主成分分析) RF(随机森林)
在线阅读 下载PDF
矿井突水水源识别的主成分分析-混沌麻雀搜索-RF模型 被引量:8
18
作者 黄敏 毛岸 +2 位作者 路世昌 王彦彬 邵良杉 《安全与环境学报》 CAS CSCD 北大核心 2023年第8期2607-2614,共8页
为快速、准确地识别矿井突水水源,根据矿井不同含水层水化学成分的差异性,将Na^(+)+K^(+)、Ca^(2+)、Mg^(2+)、Cl^(-)、SO_(4)^(2-)、HCO_(3)^(-)及总硬度作为判别指标。利用主成分分析(Principal Component Analysis,PCA)对数据进行降... 为快速、准确地识别矿井突水水源,根据矿井不同含水层水化学成分的差异性,将Na^(+)+K^(+)、Ca^(2+)、Mg^(2+)、Cl^(-)、SO_(4)^(2-)、HCO_(3)^(-)及总硬度作为判别指标。利用主成分分析(Principal Component Analysis,PCA)对数据进行降维,并通过混沌麻雀搜索算法(Chaotic Sparrow Search Algorithm,CSSA)对随机森林(Random Forest,RF)模型中树深和树数目参数进行寻优,建立了基于PCA-CSSA-RF的矿井突水水源识别模型。选取新庄孜矿实测的45组样本数据进行预测分析,33组数据用于模型训练,12组数据用于识别测试,并将结果与其他模型识别结果进行对比。研究表明,利用PCA对数据进行降维可以减少原始数据中的冗余,利用CSSA优化的RF模型可提高全局搜索能力和预测能力,用该模型可提高突水水源识别的效率和准确率。 展开更多
关键词 安全工程 矿井突水 水源识别 主成分分析 混沌麻雀搜索 随机森林
原文传递
基于随机森林和偏相关分析的小儿肺炎痰热闭肺证中医证候诊断模型研究 被引量:12
19
作者 宫文浩 兰天莹 +4 位作者 杨燕 戴启刚 冯容 何贤芬 艾军 《中华中医药杂志》 CAS CSCD 北大核心 2023年第9期4497-4501,共5页
目的:基于随机森林(RF)和偏相关分析(PCA)的方法,构建小儿肺炎痰热闭肺证中医证候诊断模型。方法:以大样本、多中心小儿肺炎痰热闭肺证病例作为数据源,运用RF方法建立小儿肺炎痰热闭肺证诊断模型,以准确率、召回率、灵敏度、特异度、精... 目的:基于随机森林(RF)和偏相关分析(PCA)的方法,构建小儿肺炎痰热闭肺证中医证候诊断模型。方法:以大样本、多中心小儿肺炎痰热闭肺证病例作为数据源,运用RF方法建立小儿肺炎痰热闭肺证诊断模型,以准确率、召回率、灵敏度、特异度、精确度和受试者工作特征(ROC)曲线下面积(AUC)进行模型评价,并对提取的模型重要特征症状进行PCA。结果:超参数优化后的RF模型准确率为90.58%,灵敏度为94.52%,特异度为86.15%。其中关键特征变量为痰多黏稠、痰色黄、苔薄黄、舌红、流涕、气喘、气促、咽红、苔黄腻、发热等。其主要病机为“痰”和“热”。结论:基于RF和PCA可以有效建立小儿肺炎痰热闭肺证辨证诊断模型,为小儿肺炎临床辨证论治提供客观依据,为中医药标准化进程提供参考。 展开更多
关键词 随机森林 偏相关分析 小儿肺炎 痰热闭肺证 中医证候诊断模型
原文传递
基于腔体匹配的刻蚀设备智能化检测技术
20
作者 李琛 周涛 《集成电路应用》 2022年第7期32-37,共6页
阐述腔体匹配(Chamber Matching, CM)是纳米尺度半导体工艺最为关键的挑战之一,随着特征尺寸的不断缩小,半导体工艺对细微误差变得越发敏感,对设备性能的一致性、稳定性提出了更高的要求。在量产Fab中,同一产品、工艺经过不同的腔体需... 阐述腔体匹配(Chamber Matching, CM)是纳米尺度半导体工艺最为关键的挑战之一,随着特征尺寸的不断缩小,半导体工艺对细微误差变得越发敏感,对设备性能的一致性、稳定性提出了更高的要求。在量产Fab中,同一产品、工艺经过不同的腔体需获得一致的工艺结果,但由于刻蚀设备数量多,腔体数量大,腔体情况复杂,结果往往存在偏差。快速发现腔体状态变化,及时根因溯源,甚至提前预知腔体潜在问题对于半导体制造具有显著价值,传统FDC功能监控数据维度较少,分析方法单一,逐渐变得难以适应先进的工艺需求。提出了一套综合而有效的智能化分析方法,融合主成分分析(principle component analysis,PCA)和随机森林对传感器进行重要性排序,定位失配的工艺步骤(step)和问题传感器。针对设备数据特征维度大、干扰性强和冗余度高的特点,采用逐步回归,提炼高质量特征,改善模型的分类效果。最后通过与Fab工程师协同,更换部件,监控效果,完成对腔体问题的全周期监控,从而保证Fab生产高效稳定地进行。 展开更多
关键词 集成电路制造 腔体匹配 智能检测 随机森林 主成分分析
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部