期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
Prediction of hot-rolled strip crown based on Boruta and extremely randomized trees algorithms 被引量:4
1
作者 Li Wang Song-lin He +1 位作者 Zhi-ting Zhao Xian-du Zhang 《Journal of Iron and Steel Research International》 SCIE EI CAS CSCD 2023年第5期1022-1031,共10页
The quality of hot-rolled steel strip is directly affected by the strip crown.Traditional machine learning models have shown limitations in accurately predicting the strip crown,particularly when dealing with imbalanc... The quality of hot-rolled steel strip is directly affected by the strip crown.Traditional machine learning models have shown limitations in accurately predicting the strip crown,particularly when dealing with imbalanced data.This limitation results in poor production quality and efficiency,leading to increased production costs.Thus,a novel strip crown prediction model that uses the Boruta and extremely randomized trees(Boruta-ERT)algorithms to address this issue was proposed.To improve the accuracy of our model,we utilized the synthetic minority over-sampling technique to balance the imbalance data sets.The Boruta-ERT prediction model was then used to select features and predict the strip crown.With the 2160 mm hot rolling production lines of a steel plant serving as the research object,the experimental results showed that 97.01% of prediction data have an absolute error of less than 8 lm.This level of accuracy met the control requirements for strip crown and demonstrated significant benefits for the improvement in production quality of steel strip. 展开更多
关键词 Hot-rolled strip Data improvement Strip crown Feature selection boruta algorithm Extremely randomized trees algorithm
原文传递
融合MHSA与Boruta的电力系统暂态功角稳定关键特征筛选 被引量:2
2
作者 王曼 周小雨 +2 位作者 陈凡 赖业宁 朱瑛 《电力工程技术》 北大核心 2025年第1期155-164,共10页
现有暂态稳定特征选择方法中初始特征的选定会限制后续寻找最佳特征组合的能力,同时缺乏客观方法来确定关键特征的数量,为此,文中提出一种融合多头自注意力(multi-head self-attention,MHSA)与Boruta的暂态功角稳定关键特征筛选方法。首... 现有暂态稳定特征选择方法中初始特征的选定会限制后续寻找最佳特征组合的能力,同时缺乏客观方法来确定关键特征的数量,为此,文中提出一种融合多头自注意力(multi-head self-attention,MHSA)与Boruta的暂态功角稳定关键特征筛选方法。首先,构建深度神经网络模型,并在输入侧添加MHSA模块进行暂态稳定评估。MHSA直接面向输入的电网特征,可在模型训练过程中自适应调整注意力权重,聚焦关键特征。其次,利用Boruta算法生成真假特征组合,经过MHSA模型的训练,选择高于最大虚假特征权重的真实特征,由模型本身确定关键特征数量。最后,在IEEE 39和IEEE 118节点系统上进行算例分析。算例结果表明,所提方法可在保证评估精度的同时大幅减少输入特征的数量,相比于传统方法,可选出评估精度更高的关键特征。 展开更多
关键词 多头自注意力(MHSA) boruta算法 暂态稳定 特征选择 关键特征 虚假特征
在线阅读 下载PDF
基于Boruta算法和logistic回归模型的欧盟建筑业员工职业伤害影响因素分析 被引量:1
3
作者 李志安 张林 +1 位作者 张鹏 朱晓俊 《环境与职业医学》 北大核心 2025年第2期151-156,共6页
[背景]建筑业员工是职业伤害的高发群体。目前,国内外关于建筑业员工职业伤害影响因素的探讨多侧重于人口学以及行为特征等,对社会心理风险、数字技术使用以及员工健康状况则关注不足。[目的]分析建筑业员工职业伤害的发生情况,探讨社... [背景]建筑业员工是职业伤害的高发群体。目前,国内外关于建筑业员工职业伤害影响因素的探讨多侧重于人口学以及行为特征等,对社会心理风险、数字技术使用以及员工健康状况则关注不足。[目的]分析建筑业员工职业伤害的发生情况,探讨社会心理风险、数字技术使用、健康状况和工作场所预防措施等层面因素对职业伤害的影响,为预防措施的制定提供依据。[方法]应用欧盟职业安全与健康管理局公开数据,样本包括2 167名建筑业员工。以员工存在职业伤害为结局变量,通过卡方检验提取其中社会心理风险、对数字技术的使用、健康状况和工作场所预防措施等层面共25个变量,应用Boruta算法和多因素logistic回归分析模型相结合的方法,识别影响职业伤害的关键因素。[结果]在调查的2 167名建筑业员工中,存在职业伤害的有182人(占8.6%)。Boruta算法识别出8个重要特征变量,变量重要性由高到低依次是肌肉骨骼疾患、工种、抑郁与焦虑、受教育水平、使用电子智能产品、工作场所及时解决安全问题、全身疲劳、年龄;logistic回归分析显示:年龄、工种、受教育水平、全身疲劳、肌肉骨骼疾患以及工作场所及时解决安全问题共6个变量对职业伤害的影响有统计学意义(P <0.05)。[结论]建筑业员工职业伤害的发生受多种因素影响,包括年龄、工种、受教育水平、全身疲劳、肌肉骨骼疾患以及工作场所及时解决安全问题。企业和员工应采取针对性的措施,减少职业伤害的发生。 展开更多
关键词 建筑业员工 职业伤害 影响因素 boruta算法 LOGISTIC回归
原文传递
基于Boruta+PSO-MLP模型的中央空调系统能耗预测
4
作者 赵昱 颜承初 +3 位作者 郭霖 程远达 王昊博 龚雷阳 《太原理工大学学报》 北大核心 2025年第6期1154-1161,共8页
【目的】空调能耗在整个建筑能耗中具有重要的地位,建立空调系统能耗模型可以帮助建筑运营人员制定精确的能源管理计划,优化建筑能耗设备的运行,实现智能化的能源管理。【方法】提出一种混合空调系统能耗组合预测模型,利用粒子群优化算... 【目的】空调能耗在整个建筑能耗中具有重要的地位,建立空调系统能耗模型可以帮助建筑运营人员制定精确的能源管理计划,优化建筑能耗设备的运行,实现智能化的能源管理。【方法】提出一种混合空调系统能耗组合预测模型,利用粒子群优化算法(Particle Swarm Optimiza⁃tion,PSO)对多层感知机(Multi-Layer Perceptron,MLP)的超参数进行优化,并使用Boruta对数据集进行特征选择,建立PSO-MLP模型来预测系统能耗。【结果】研究结果表明,基于Boruta+PSOMLP的能耗预测模型能够更准确地预测建筑空调能耗,对比单一的MLP模型,平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)分别降低了57.3%和49.7%,相关系数达到了0.962。 展开更多
关键词 中央空调 能耗预测 boruta特征选择 粒子群优化算法 多层感知机
在线阅读 下载PDF
高维数据下基于Boruta-RFE算法的特征选择研究
5
作者 饶文康 黄介武 +1 位作者 陈星悦 王淋杰 《智能计算机与应用》 2025年第8期52-58,共7页
针对高维数据特征选择过程中传统的Boruta算法通常会选择出一些冗余或不相关的特征,从而降低分类器性能的问题,本文在Boruta算法的基础上提出了Boruta-RFE算法,进一步筛选出更优的特征子集。首先将Boruta算法对4个不同高维数据集进行特... 针对高维数据特征选择过程中传统的Boruta算法通常会选择出一些冗余或不相关的特征,从而降低分类器性能的问题,本文在Boruta算法的基础上提出了Boruta-RFE算法,进一步筛选出更优的特征子集。首先将Boruta算法对4个不同高维数据集进行特征选择,然后在其基础上利用递归特征消除(RFE)分别对其进行特征选择后得到所需最优特征子集,最后用随机森林、支持向量机及逻辑回归分类器分别对其进行分类,分类结果表明该算法分别在准确率、AUC值、F1值、精确率及Kappa值整体上优于传统的Boruta算法,有效减少了所选特征子集的特征数量,并提高了分类效率,由此验证了此方法的有效性。 展开更多
关键词 特征选择 boruta算法 RFE算法 机器学习
在线阅读 下载PDF
Ⅲ—Ⅳ期肺癌免疫检查点抑制剂治疗30天内非计划再入院风险预测模型
6
作者 邓波 彭曹霞 +2 位作者 熊启连 辇伟奇 刘影 《实用医学杂志》 北大核心 2026年第1期1-11,共11页
目的 探讨Ⅲ—Ⅳ期肺癌免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)治疗后30 d内非计划再入院(unplanned patient readmission,UPR)的危险因素,构建并验证相应的风险预测模型。方法 收集2023年1月至2024年5月在重庆市中医院接... 目的 探讨Ⅲ—Ⅳ期肺癌免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)治疗后30 d内非计划再入院(unplanned patient readmission,UPR)的危险因素,构建并验证相应的风险预测模型。方法 收集2023年1月至2024年5月在重庆市中医院接受ICIs治疗的Ⅲ—Ⅳ期肺癌患者的资料。应用Boruta算法初筛风险因素,采用logistic回归识别独立危险因素,构建列线图预测模型。通过受试者工作特征曲线(ROC)评估模型区分能力,以校准曲线验证模型一致性,利用决策曲线分析(DCA)评估其临床实用性。采用限制性立方样条回归(RCS)联合SHAP可解释分析明确危险因素与非计划再入院之间的剂量反应关系及阈值点。结果 最终纳入284例患者,UPR发生率为30.63%。logistic回归分析显示住院天数、NRS 2002评分、介入治疗及KPS评分是非计划再入院的独立风险因素(P<0.05)。模型训练集的ROC曲线AUC=0.88,95%CI:0.84~0.93,灵敏度84%,特异度80%,验证集的ROC曲线AUC=0.87,95%CI:0.79~0.95,灵敏度82%,特异度70%,模型的校准曲线接近于对角线,显示良好的准确性;DCA分析显示模型阈值在10%~90%之间具有净获益,SHAP分析显示住院天数是UPR的关键因素,SHAP-RCS分析发现住院天数> 6.43 d、NRS 2002>2.05、KPS<79.01且有介入手术史的患者再入院风险更高。结论 基于4个风险因素构建的预测模型能有效预测Ⅲ—Ⅳ期肺癌ICIs患者30 d内非计划再入院的风险,具有良好的临床适用性,对于高风险患者应予以重点关注及提前干预。 展开更多
关键词 肺癌 免疫检查点抑制剂治疗 非计划再入院 boruta算法 预测模型
暂未订购
基于Boruta-支持向量回归的安徽省土壤pH值预测制图 被引量:15
7
作者 卢宏亮 赵明松 +2 位作者 刘斌寅 张平 陆龙妹 《地理与地理信息科学》 CSCD 北大核心 2019年第5期66-72,共7页
以安徽省为研究区域,将Boruta算法用于特征筛选,选择最优变量组合输入支持向量回归(SVR)模型,经参数优化和核函数对比后,选择最优的SVR预测模型进行土壤pH值空间分布制图。结果表明:1)使用Boruta算法筛选后的特征变量建模优于全部变量建... 以安徽省为研究区域,将Boruta算法用于特征筛选,选择最优变量组合输入支持向量回归(SVR)模型,经参数优化和核函数对比后,选择最优的SVR预测模型进行土壤pH值空间分布制图。结果表明:1)使用Boruta算法筛选后的特征变量建模优于全部变量建模;特征变量重要性分析表明,年均降水(MAP)是影响安徽省土壤pH值的最重要因素,多尺度山谷平坦指数(MrVBF)、多尺度山脊平坦指数(MrRTF)和年均温(MAT)等特征变量均对土壤pH值有较重要的影响。2)选择径向基函数(RBF)作为核函数建立SVR模型进行土壤pH值预测最为合理;参数C=1,γ=0.125时,SVR模型精度最高,可以解释土壤pH值变异的74%,验证集R^2为0.62。3)土壤pH值预测制图结果表明,安徽省土壤pH值空间分布呈由北至南逐渐降低的趋势,符合“南酸北碱”特征,且预测制图的统计结果与样本点的统计结果基本一致。将Boruta算法与SVR模型结合可以提高土壤pH值的预测制图精度,且模型的泛化能力较强。 展开更多
关键词 土壤pH值预测 boruta算法 核函数 支持向量机回归 安徽省
在线阅读 下载PDF
基于CEA+Boruta模式的特征选择算法 被引量:3
8
作者 朱颢东 常志芳 《湖北民族大学学报(自然科学版)》 CAS 2020年第3期349-354,共6页
近年来,特征选择在机器学习领域中应用十分广泛.为提高文本计算效率,改善数据分类性能,提出两步法解决特征选择问题.结合过滤式中CEA算法和封装式中Boruta算法,引入参数p控制Boruta算法中阴影部分比例,提高封装阶段效率,降低整体算法时... 近年来,特征选择在机器学习领域中应用十分广泛.为提高文本计算效率,改善数据分类性能,提出两步法解决特征选择问题.结合过滤式中CEA算法和封装式中Boruta算法,引入参数p控制Boruta算法中阴影部分比例,提高封装阶段效率,降低整体算法时间复杂度,筛选出较优的候选特征集.在三个数据集上利用随机森林分类器进行实验,结果表明,该算法在平均分类错误率,召回率,准确率和F1值上均优于传统的Boruta和CEA算法,能够有效地减少最终选择的特征子集中的特征数量,提高文本分类效率和预测性能. 展开更多
关键词 特征选择 降维 boruta CEA 机器学习
在线阅读 下载PDF
一种基于SAR影像的气候复杂地区地表水提取方法 被引量:3
9
作者 顾祯蓉 李勇 +5 位作者 葛莹 王鸿燕 储思敏 刘秀慧 赖美芸 丁涵 《时空信息学报》 2025年第1期83-93,共11页
地表水是保障生态平衡、维系人类生存的重要自然资源。在可见光影像匮乏的多云多雨区域,如何借助合成孔径雷达(synthetic aperture radar,SAR)影像,克服样本数量有限这一难题,精准获取地表水分布信息,是一个极具挑战性的问题。以肯尼亚... 地表水是保障生态平衡、维系人类生存的重要自然资源。在可见光影像匮乏的多云多雨区域,如何借助合成孔径雷达(synthetic aperture radar,SAR)影像,克服样本数量有限这一难题,精准获取地表水分布信息,是一个极具挑战性的问题。以肯尼亚地表水资源监测为研究对象,本文利用Sentinel-1A数据,提出一种半监督协同随机森林的SAR影像气候复杂地区地表水提取方法。首先,利用灰度共生矩阵提取SAR影像的纹理特征,结合极化特征、水体指数和地形特征等,建立多维特征空间;其次,利用Boruta算法进行特征优选,并利用随机森林基分类器结合半监督协同训练方法,构建半监督协同随机森林模型,提取研究区地表水分布;最后,为验证方法可行性,与常用方法进行比较评价。结果表明,本文方法在仅有少量样本的情况下,能够更好地区分水体与非水体的差异,提高了对水体细节处的识别能力,降低模型漏检率,水体分类总体精度、召回率、F1分数分别达到91.54%、88.31%、92.08%。 展开更多
关键词 SAR影像 Sentinel-1卫星遥感 水体提取 特征优选 半监督学习 随机森林 boruta算法
在线阅读 下载PDF
基于合成影像和多变量的博斯腾湖流域土壤有机碳含量估测 被引量:1
10
作者 李顿 王雪梅 +1 位作者 李坤玉 郭艳萍 《环境科学》 北大核心 2025年第7期4428-4440,共13页
选择合适的多时相遥感影像合成方法以及建模变量对于土壤有机碳含量的估测及其空间分布反演具有重要作用.以新疆博斯腾湖流域土壤有机碳含量为研究对象,按照最小值、中值以及均值Sentinel-2多时相卫星影像合成方法生成光谱变量,同时引... 选择合适的多时相遥感影像合成方法以及建模变量对于土壤有机碳含量的估测及其空间分布反演具有重要作用.以新疆博斯腾湖流域土壤有机碳含量为研究对象,按照最小值、中值以及均值Sentinel-2多时相卫星影像合成方法生成光谱变量,同时引入气候和地形等环境变量作为建模变量.结合Boruta变量筛选算法和随机森林(RF)模型分析探究不同影像合成方法以及变量集合对耕层土壤有机碳含量估测的影响及差异.结果表明:①环境变量结合光谱变量能够较好地估测土壤有机碳含量,环境变量中的气候变量对博斯腾湖流域土壤有机碳含量的建模估测发挥着关键作用;②相对于全变量集合,经过Boruta变量筛选算法后的特征变量模型估测精度要更好;③均值合成的影像光谱变量结合环境变量的建模效果最好,最优模型的估测精度R^(2)为0.97,RMSE为2.919 g·kg^(−1),RPD为5.319.使用Boruta变量筛选算法对多时相均值合成光谱变量与环境变量所建立的RF模型能够准确地实现博斯腾湖流域土壤有机碳含量的空间反演估测,为该流域土壤有机碳含量的准确估测提供技术支持. 展开更多
关键词 影像合成 光谱和环境变量 boruta算法 随机森林(RF)模型 土壤有机碳(SOC) 博斯腾湖流域
原文传递
基于三种特征筛选法的乳腺癌复发转移预测模型构建 被引量:1
11
作者 蔡一伟 吴尔律 +3 位作者 王冶 李程 刘晓红 蒙华 《中国数字医学》 2025年第3期36-43,共8页
目的:基于3种特征筛选方法构建乳腺癌复发转移预测模型,并比较其预测性能。方法:回顾性收集2017年―2021年广西某三甲医院乳腺癌复发转移患者373例的临床资料,纳入自变量指标30个。采用单因素和多因素分析、随机森林嵌套结合递归特征消... 目的:基于3种特征筛选方法构建乳腺癌复发转移预测模型,并比较其预测性能。方法:回顾性收集2017年―2021年广西某三甲医院乳腺癌复发转移患者373例的临床资料,纳入自变量指标30个。采用单因素和多因素分析、随机森林嵌套结合递归特征消除、基于Boruta的随机森林特征降维3种方法,按训练集和测试集6:4分别构建基于随机森林的乳腺癌复发转移预测模型,并比较其准确率、精确率、召回率、F1值和AUC值。结果:基于Boruta的随机森林模型(Boruta-RF)筛选获得的重要特征为组织学分级、N分期、肿瘤分期、治疗中是否发生肺叶炎症、CA153,其预测模型整体精度及泛化能力综合最佳,在测试集准确率为0.787、精确率0.760、召回率0.655、F1值0.703、AUC 0.819。结论:Boruta-RF模型预测乳腺癌复发转移效果较好,可为临床制定个性化治疗方案提供参考,但仍需更多前瞻性多中心研究验证。 展开更多
关键词 乳腺癌 特征筛选 机器学习 boruta算法 预测模型
在线阅读 下载PDF
早期心房颤动预测模型构建:基于中国人群窦性心律期间心电定量特征
12
作者 朱晓庆 石亚君 +5 位作者 沈娟 王清松 宋婷婷 修建成 陈韬 郭军 《南方医科大学学报》 北大核心 2025年第2期223-228,共6页
目的基于中国人群的心电大数据开发早期房颤风险预测模型。方法回顾性纳入2009年~2023年于解放军总医院有多次心电图检查记录的患者30383例。患者按7∶3的比例随机划分为训练集和内部测试集。使用训练集数据,采用单因素分析、LASSO回归... 目的基于中国人群的心电大数据开发早期房颤风险预测模型。方法回顾性纳入2009年~2023年于解放军总医院有多次心电图检查记录的患者30383例。患者按7∶3的比例随机划分为训练集和内部测试集。使用训练集数据,采用单因素分析、LASSO回归、Boruta算法筛选预测因子。基于Cox比例风险回归建立心电模型以及结合年龄、性别和心电模型评分的复合模型。采用受试者工作特征分析曲线下面积(AUROC)、校准曲线、决策曲线评估模型区分度、校准度及临床净获益。结果纳入患者的中位年龄为51(36,62)岁,男性占比51.1%,房颤的发生率为4.5%(1370/30383)。在心电模型中,P波相关参数及QRS波相关参数是重要预测变量。在测试集中,心电模型预测5年房颤风险的AUROC为0.77(95%CI:0.74-0.80),加入年龄和性别后的复合模型AUROC提升至0.81(95%CI:0.78-0.83),净重新分类指数为0.123,综合判别改善指数为0.04(P<0.05)。模型校准曲线斜率接近对角线。决策曲线分析显示复合模型的临床净获益在绝大多数风险阈值范围内均高于心电模型。结论基于中国人群窦性心律期间的心电图定量特征及年龄和性别开发的复合模型可有效预测未来房颤风险,为房颤的早期风险评估及预防干预提供了低成本的筛查工具。 展开更多
关键词 心电图 心房颤动 LASSO回归 boruta算法
暂未订购
基于随机森林模型上海市社区家庭康复护理项目医保纳入现况调查
13
作者 胡玉红 张明辉 +3 位作者 郭丽君 孙炜 黄春玉 鲍勇 《中国卫生事业管理》 北大核心 2025年第4期381-388,397,共9页
目的:调查上海市社区卫生服务机构康复护理项目纳入医保实际情况,探究康复护理纳入医保的影响因素,为开展康复护理项目提供建议。方法:采用分阶段随机整群抽样方法,对上海市36家社区卫生服务机构进行问卷调查。采用Spearman相关分析探... 目的:调查上海市社区卫生服务机构康复护理项目纳入医保实际情况,探究康复护理纳入医保的影响因素,为开展康复护理项目提供建议。方法:采用分阶段随机整群抽样方法,对上海市36家社区卫生服务机构进行问卷调查。采用Spearman相关分析探讨康复护理项目纳入医保的单相关因素,采用Boruta算法进行特征筛选,将相关性分析和特征筛选结果综合,纳入二元Logistic回归模型来探索是否将康复护理项目纳入医保的影响因素。结果:27.78%的机构将康复护理纳入医保支付,Spearman相关分析显示是否将康复指导项目纳入医保支付呈显著的正相关(r=0.531,P<0.05),而推荐康复指导家庭项目(r=-0.482,P<0.05)、推荐康复护理家庭项目(r=-0.446,P<0.05)则呈显著的负相关。Boruta算法显示是否将康复指导纳入医保支付、推荐家庭康复护理项目、推荐家庭康复指导项目为重要变量,家庭病床数、职工医保结算方式、常住人口数、康复床位数为暂定变量。二元Logistic回归显示是否将康复指导项目纳入医保支付(OR=10.994,95%CI:1.583~76.342)、推荐康复护理家庭项目进入方程(OR=0.108,95%CI:0.015~0.801),且结果显著。结论:应该规范康复护理及康复指导定义,制定合理康复护理收费标准;将家庭康复护理项目纳入长期护理保险服务范畴;多方面加强家庭康复护理的发展,加大对家庭照护者康复护理知识普及。 展开更多
关键词 康复护理项目 医保支付 boruta算法 现况
暂未订购
构建和验证乳腺癌患者麻醉苏醒延迟风险的机器学习网络计算器
14
作者 葛亮 冷玉芳 +2 位作者 张鹏 孔令国 韩旭东 《中国临床药理学与治疗学》 北大核心 2025年第9期1182-1192,共11页
目的:基于机器学习(ML)模型构建网络计算器预测乳腺癌(BC)患者麻醉苏醒延迟风险。方法:选取本院2023年1月至2024年6月手术治疗的435例BC患者。使用Boruta算法筛选麻醉苏醒延迟风险重要特征变量。根据3∶2比例将所有患者随机分配为训练集... 目的:基于机器学习(ML)模型构建网络计算器预测乳腺癌(BC)患者麻醉苏醒延迟风险。方法:选取本院2023年1月至2024年6月手术治疗的435例BC患者。使用Boruta算法筛选麻醉苏醒延迟风险重要特征变量。根据3∶2比例将所有患者随机分配为训练集(n=261)和测试集(n=174)并构建和训练9种ML模型。根据10次随机抽样的受试者工作特征(ROC)曲线评估9种ML模型并使用决策曲线分析评估模型临床实用价值。结合SHapley加法解释(SHAP)条形图、摘要图和力图附加解释和可视化ML模型。使用R包构建预测BC患者麻醉苏醒延迟风险的网络计算器。结果:435例BC患者中,25.1%患者出现麻醉苏醒延迟。Boruta算法筛选出7个特征变量。ROC曲线显示9种ML模型中XGBoost模型的10次随机抽样的曲线下面积(AUC)最高,决策曲线显示XGBoost模型具有显著临床净收益。SHAP条形图显示重要性排序为ASA分级、手术时间、麻醉时间、术中失血量、丙泊酚、术前贫血和术中低体温。SHAP摘要图反映7个重要特征变量的影响范围分布,呈“两端分离”现象。SHAP力图可视化XGBoost模型预测单个患者麻醉苏醒延迟风险,麻醉苏醒延迟患者预测值为0.998,无麻醉苏醒延迟患者预测值为0.00891。基于可解释XGBoost模型的网络计算器(https://xz-nomogram.shinyapps.io/DE_web/)能有效预测BC患者麻醉苏醒延迟风险。结论:ASA分级、手术时间、丙泊酚、术中失血量、麻醉时间、术前贫血和术中低体温是BC患者麻醉苏醒延迟风险重要特征变量。基于可解释XGBoost模型的网络计算器能准确快捷定量麻醉苏醒延迟风险,有助于临床医生有效调整治疗策略,更好改善患者预后。 展开更多
关键词 乳腺癌 麻醉苏醒延迟 机器学习 boruta算法 SHAP XGBoost模型 网络计算器
暂未订购
城市群新质生产力与新型城镇化发展质量耦合协调的时空演变及驱动机制研究
15
作者 张世斌 何云鹏 +1 位作者 杨肃昌 张瑾 《经济问题探索》 北大核心 2025年第7期94-115,共22页
推进新质生产力与新型城镇化的协同发展是中国城市群实现高质量发展的双重战略支点。基于2011—2021年中国十大城市群的数据,评估了新质生产力和新型城镇化发展质量耦合协调的时空演变与驱动机制。研究发现:新质生产力与新型城镇化发展... 推进新质生产力与新型城镇化的协同发展是中国城市群实现高质量发展的双重战略支点。基于2011—2021年中国十大城市群的数据,评估了新质生产力和新型城镇化发展质量耦合协调的时空演变与驱动机制。研究发现:新质生产力与新型城镇化发展质量之间的共生关系和协同进步趋势日益强化,不同城市群之间的耦合协调度存在显著差异。珠三角城市群处于中级协调水平,长三角和海峡西岸城市群处于初级协调水平,京津冀、辽中南、山东半岛和中原城市群勉强达到协调水平,而长江中游、成渝和关中平原城市群则接近失调状态。新质生产力和新型城镇化发展质量的耦合协调度呈现集聚效应,主要集聚在珠三角、长三角和京津冀等城市群的核心城市。结合机器学习和实证分析,揭示经济发展、经济集聚、金融发展、就业结构、产业结构和数字经济政策是推动二者耦合协调发展的主要驱动因素。研究结论对于促进城市群新质生产力与新型城镇化发展质量的良性互动和协同发展具有重要的指导意义。 展开更多
关键词 城市群 新质生产力 新型城镇化发展质量 耦合协调 Lasso算法 boruta算法
原文传递
基于机器学习构建全髋置换术患者术后谵妄风险的预测模型
16
作者 王小锋 蔡宁 +2 位作者 王建彭 杨芳芳 王秋锋 《临床麻醉学杂志》 北大核心 2025年第10期1021-1027,共7页
目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),... 目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),ASAⅠ—Ⅲ级。通过Boruta算法筛选THA患者发生POD的风险因素。基于风险因素构建、训练和比较6种ML模型,使用受试者工作特征(ROC)曲线和校准曲线评估6种ML模型,筛选最佳预测性能模型。使用SHAP值对ML模型进行解释和可视化,并使用Shiny等R包开发预测THA患者POD风险的在线应用程序。结果 有65例(23.8%)患者发生POD。Boruta算法筛选出麻醉时间、C-反应蛋白(CRP)浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及白蛋白(Alb)浓度是THA患者发生POD的风险因素。6种ML算法中,ROC曲线和校准曲线证实极端梯度提升(XGBoost)模型预测POD风险性能最高。基于SHAP值附加解释和可视化XGBoost模型能以极高准确度预测POD风险。在线应用程序网址https://mldynamic.shinyapps.io/PD-web/。结论 麻醉时间、CRP浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及Alb浓度是THA患者发生POD的风险因素。基于SHAP值解释的XGBoost模型有极高的预测性能,基于此开发的在线应用程序能帮助使用者快捷计算THA患者POD风险,优化治疗方案。 展开更多
关键词 全髋置换术 术后谵妄 机器学习 boruta算法 Shapley加性解释
暂未订购
基于改进Apriori的网络高维数据关联特征挖掘
17
作者 王灵 侯春明 《现代电子技术》 北大核心 2025年第24期67-71,共5页
为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K... 为可靠挖掘具有维度高、倍增特点且呈稀疏分布的网络数据之间的关联特征,提出一种基于改进Apriori的网络高维数据关联特征挖掘方法。采用Boruta算法在原始网络高维数据中筛选出最具有代表性的特征,并有效处理其中的冗余特征数据;通过K最近邻插补子空间聚类算法插补选择的特征数据,以提升特征数据的完整性和连续性;利用改进Apriori算法挖掘插补后的特征数据集,结合关联规则支持度、置信度和提升度的计算结果确定多个关联规则强度,更好地判断特征之间的关联程度,实现网络高维数据关联特征的挖掘。测试结果表明:所提方法具有较好的特征选择能力,归一化互信息结果均在0.909以上,特征冗余程度均低于0.0155;且能够较好地实现缺失特征插补处理,并依据设定阈值范围完成网络高维数据关联特征挖掘。 展开更多
关键词 高维数据 关联特征挖掘 数据插补 APRIORI算法 boruta算法 特征选择
在线阅读 下载PDF
2021年惠州市12 109名高校学生艾滋病知识知晓率及防治需求的调查研究
18
作者 邓文峰 黄琳 丘文清 《预防医学情报杂志》 2025年第12期1611-1620,共10页
目的 了解惠州市高校学生干预前艾滋病知识知晓情况及其防治需求意愿,为艾滋病宣教干预政策的制定和完善提供科学依据。方法 于2021年1月至2022年6月,采用电子问卷的方法调查惠州市6所高校在读学生,内容包括一般人口学资料、艾滋病知识... 目的 了解惠州市高校学生干预前艾滋病知识知晓情况及其防治需求意愿,为艾滋病宣教干预政策的制定和完善提供科学依据。方法 于2021年1月至2022年6月,采用电子问卷的方法调查惠州市6所高校在读学生,内容包括一般人口学资料、艾滋病知识、以及性教育、艾滋病宣教、自愿咨询检测(以下简称VCT)等方面的健康教育意愿和需求。知晓率以艾滋病知识问卷前8题进行计算,总知晓率以24题进行计算。宣教需求的组间比较采用Fisher确切概率法,多重检验的P值采用FDR法进行校正。多因素分析均使用R4.3.3软件进行,对艾滋病知晓率多因素分析采用多重线性回归,艾滋病防治需求意愿的多因素分析采用Boruta算法,以P<0.05作为双侧检验水准。结果 本研究收集了12 109份有效问卷,艾滋病知识知晓率为71.14%,总体知晓率为71.93%。以知晓率为因变量,一般人口学资料为自变量,进行多重线性回归分析,结果显示女性知晓率比男性高3.93%(95%CI:3.22%~4.64%,P<0.001),外市户籍学生知晓率比本市学生高2.81%(95%CI:1.90%~3.71%,P<0.001),农村学生知晓率比城市学生低2.65%(95%CI:-3.44%~-1.87%,P<0.001),大二学生知晓率比大一学生高0.87%(95%CI:0.12%~1.62%,P=0.022),生活费在2001~<3000元和≥3 001元以上的学生知晓率分别比2 000元以下的学生低1.3 2%(95%CI:-2.41%~-0.22%,P=0.019)和7.04%(95%CI:-9.02%~-5.06%,P<0.001)。以艾滋病防治需求意愿为结局变量,通过Boruta算法进行重要特征筛选,分析显示性别的重要性评分最高。将重要特征筛选结果,性别作为分组依据,对宣教需求意愿进行比较发现,女学生在性教育、艾滋病宣教、VCT宣教3个方面的需求意愿均显著高于男学生,差异有统计学意义(P<0.001)。其中,女学生有性教育宣教意愿需求的比例为79.34%,男学生为59.18%;女学生有艾滋病防治信息宣教需求的比例为60.11%,男学生为45.84%;女学生认为VCT有必要在校园推广的比例为88.01%,男学生为79.61%;女学生认为性行为后需要进行VCT的比例为79.34%,男学生为59.18%。结论惠州市高校学生的艾滋病知识知晓率处在国内中等水平,但有较高的宣教干预需求,应以性别作为重要特征,结合学校课程和同伴教育开展有针对性的健康教育。 展开更多
关键词 高校学生 艾滋病 健康教育 机器学习 boruta算法
原文传递
急性加重性慢性阻塞性肺疾病低钠血症风险因素分析及预测模型构建
19
作者 余同乐 吴安安 +3 位作者 张叶斌 黄超 方柳 王涛 《蚌埠医科大学学报》 2025年第8期1065-1069,共5页
目的:分析慢性阻塞性肺疾病急性加重期(AECOPD)病人发生低钠血症风险因素,并构建预测低钠血症风险的动态列线图。方法:分析224例AECOPD病人,通过Boruta算法筛选低钠血症重要风险因素。采用受试者工作特征(ROC)曲线分析变量曲线下面积(A... 目的:分析慢性阻塞性肺疾病急性加重期(AECOPD)病人发生低钠血症风险因素,并构建预测低钠血症风险的动态列线图。方法:分析224例AECOPD病人,通过Boruta算法筛选低钠血症重要风险因素。采用受试者工作特征(ROC)曲线分析变量曲线下面积(AUC)。基于风险因素构建AECOPD病人发生低钠血症风险的列线图;使用内部数据集评估列线图预测性能。使用DynNom包将列线图发布至网络中构建AECOPD病人发生低钠血症风险的动态列线图。结果:224例中50例出现低钠血症,发生率为22.3%。Boruta算法发现白蛋白(ALB)、体质量指数(BMI)、红细胞沉降率(ESR)、2型糖尿病(T2DM)、C反应蛋白(CRP)、血糖(FBG)、肌酐(Cr)是AECOPD病人发生低钠血症的独立风险因素。ALB、BMI、ESR、T2DM、CRP、FBG和Cr诊断低钠血症AUC值分别为0.759(0.698~0.814)、0.772(0.712~0.826)、0.689(0.624~0.749)、0.625(0.558~0.689)、0.503(0.435~0.570)、0.574(0.506~0.639)、0.516(0.448~0.583)。构建AECOPD病人发生低钠血症的列线图模型,校正曲线预测值和实际值具有较好的一致性,决策曲线显示阈值概率为2.7%~100%时,列线图预测AECOPD病人发生低钠血症的净获益率较高。结论:ALB、BMI、ESR、T2DM、CPR、FBG、Cr是AECOPD病人发生低钠血症的独立危险因素,基于此构建AECOPD病人发生低钠血症的动态列线图预测模型有较好预测和临床使用价值。 展开更多
关键词 慢性阻塞性肺疾病 急性加重期 低钠血症 列线图 boruta算法
暂未订购
基于背包激光雷达的单木材积估测方法研究 被引量:8
20
作者 马超 黄华国 +3 位作者 田昕 刘炳杰 温坤剑 王鹏杰 《遥感技术与应用》 CSCD 北大核心 2022年第5期1071-1083,共13页
背包式激光雷达(Backpack Laser Scanning,BLS)在森林资源调查中具有很大的应用潜力,但在复杂地表情景下,单木材积和林分蓄积量提取精度存在较大不确定性。以广西高峰林场为研究区,利用随机森林方法,基于BLS点云数据对单木材积和样地蓄... 背包式激光雷达(Backpack Laser Scanning,BLS)在森林资源调查中具有很大的应用潜力,但在复杂地表情景下,单木材积和林分蓄积量提取精度存在较大不确定性。以广西高峰林场为研究区,利用随机森林方法,基于BLS点云数据对单木材积和样地蓄积量进行估测。首先,对BLS点云进行单木分割,提取单木胸径(DBH)、树高(Htree)、冠幅直径(CD)、冠幅面积(CA)、冠幅体积(CV)、郁闭度(CC)、间隙率(GF)和叶面积指数(LAI)共8个特征参数,并计算56个分层高度指标(高度百分比、累积高度百分比、变异系数、冠层起伏率等)。然后,通过随机森林算法构建单木材积估测模型,并对比各种参数组合的预测精度。得到结果:(1)仅用8个单木结构特征参数进行建模,估测精度为:R^(2)=0.83、RMSE=0.097 m^(3);(2)加入分层高度指标的模型估测精度有所提升:R^(2)=0.87、RMSE=0.087 m^(3);(3)通过Boruta算法进行变量筛选,输入参数从64个减少至52个,估测精度差异不大:R^(2)=0.87、RMSE=0.087 m^(3);(4)样方蓄积量估测精度为:R^(2)=0.97,RMSE=0.703m^(3)·ha-1。结果表明,基于BLS点云建立随机森林单木材积估测模型可以较好地估测单木材积,样方蓄积量估测精度高。 展开更多
关键词 单木材积 背包式激光雷达 随机森林算法 boruta算法
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部