期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于Light-GBM算法的地震动显著持时预测模型 被引量:1
1
作者 崔铭钊 公茂盛 +3 位作者 左占宣 赵一男 贾佳 张孔 《振动与冲击》 北大核心 2025年第16期185-192,共8页
地震动持时对地震结构反应有显著影响,因此对考虑持时效应的工程结构抗震设计和区域地震危险性分析具有重要意义。该研究提出了一种基于轻量级梯度提升机(light gradient boosting machine,Light-GBM)算法的地震动显著持时预测模型,基于... 地震动持时对地震结构反应有显著影响,因此对考虑持时效应的工程结构抗震设计和区域地震危险性分析具有重要意义。该研究提出了一种基于轻量级梯度提升机(light gradient boosting machine,Light-GBM)算法的地震动显著持时预测模型,基于NGA-West2数据库,筛选了其中15541条地震动记录并计算其显著持时,随后通过特征重要性筛选输入参数并利用贝叶斯优化方法调整模型超参数,最终构建了地震动显著持时的预测模型,并与其他传统模型和深度学习模型对比,从而对模型的准确性和鲁棒性进行验证。结果表明,所建立的地震动显著持时预测模型具有良好预测性能、极高的计算效率和通用性,结果可供地震动持时预测及地震危险性分析等工作参考。 展开更多
关键词 地震动持时 预测模型 轻量级梯度提升机(Light-gbm)算法 显著持时 机器学习
在线阅读 下载PDF
基于RF-Light GBM的分组密码算法识别方案
2
作者 董秀则 杨鸿刚 +1 位作者 胡一凡 于庚辰 《北京电子科技学院学报》 2025年第2期1-10,共10页
密码算法的识别在密码分析领域中具有重要意义。目前主流分组密码算法识别方案中密文特征提取普遍基于随机性检测标准。为解决短样本识别需求以及进一步提高识别准确率,本研究提出了一种基于RF-Light GBM的分组密码体制识别方案。首先通... 密码算法的识别在密码分析领域中具有重要意义。目前主流分组密码算法识别方案中密文特征提取普遍基于随机性检测标准。为解决短样本识别需求以及进一步提高识别准确率,本研究提出了一种基于RF-Light GBM的分组密码体制识别方案。首先通过GM/T 0005-2021随机性检测标准提取密文特征,其次利用随机森林算法对高维的数据进行重要性排序和筛选,然后利用特征向量训练Light GBM算法模型构建密码算法识别分类器进行识别。实现了短样本环境下高效识别未知密文的识别需求。在两两识别实验中,与现有研究相比本方案准确率整体提升约12%;多分类实验显示准确率均在73%以上,验证了本方案在分组密码算法识别中的有效性和优势,为未来在更复杂的加密模式下进行密码算法识别提供了参考。 展开更多
关键词 分组密码 机器学习 随机性检测 密码算法识别 Light gbm
在线阅读 下载PDF
优化GBM算法预测蛋白质-HEME结合残基
3
作者 郭国栋 潘星宇 +2 位作者 白云霞 包梦雪 李彩艳 《中国科技论文在线精品论文》 2025年第2期198-200,共3页
为了提升蛋白质-HEME结合残基的预测精度,本文基于Gradient Boosting Machine(GBM)算法,重点优化了其内置参数,包括最小训练样本数(minobsinnode)、决策树深度(depth)、迭代次数(n.trees)和学习速率(shrinkage)。通过总结数据科学竞赛... 为了提升蛋白质-HEME结合残基的预测精度,本文基于Gradient Boosting Machine(GBM)算法,重点优化了其内置参数,包括最小训练样本数(minobsinnode)、决策树深度(depth)、迭代次数(n.trees)和学习速率(shrinkage)。通过总结数据科学竞赛中的经验,调整最优扰动权重和参数配置,成功避免过拟合问题,并实现了更高的预测精确度。在此基础上,改进采样方法以克服样本不平衡问题,结合五折交叉检验与独立检验对模型进行全面优化。 展开更多
关键词 生物物理学 gbm算法 Heme残基 加权采样法
在线阅读 下载PDF
基于CEEMDAN-VMD-TCN-lightGBM模型的水质预测研究 被引量:6
4
作者 项新建 张颖超 +3 位作者 许宏辉 厉阳 王世乾 郑永平 《中国农村水利水电》 北大核心 2024年第3期86-95,共10页
针对目前水质预测模型中因为数据本身的复杂性、在信号处理过程中存在的噪声干扰以及分解深度不够导致单一分解难以全面捕捉信号非线性特征的问题,提出了一种基于二次分解的水质预测模型。该模型采用完全自适应噪声集合经验模态分解(CEE... 针对目前水质预测模型中因为数据本身的复杂性、在信号处理过程中存在的噪声干扰以及分解深度不够导致单一分解难以全面捕捉信号非线性特征的问题,提出了一种基于二次分解的水质预测模型。该模型采用完全自适应噪声集合经验模态分解(CEEMDAN)对原始数据进行分解,再利用变分模态分解(VMD)对熵值最高的模态分量进行二次分解,最终将处理后的时间序列输入到TCN-lightGBM多特征预测模型中。同时,采用麻雀算法(SSA)对预测模型进行优化。以山东省玉符河水质为例,本模型的均方根误差(RMSE)是0.1053,平均绝对误差(MAE)是0.0815,决定系数(R2)是0.9471,与GRU、LSTM、LightGBM、TCN等当下较为流行的模型的预测指标进行比较。结果显示,在R2上本模型提升了53.04%、70.41%、66.07%、65.20%等,在RMSE上减少了62.76%、65.50%、64.93%、64.80%等,在MAE上降低了62.76%、66.24%、63.80%、65.24%等。由此可知,基于CEEMDAN-VMD-TCN-lightGBM的模型具有更好的预测性能、泛化能力和捕捉信号非线性特征的能力。 展开更多
关键词 二次分解 TCN lightgbm 多特征预测 水质预测 麻雀算法
在线阅读 下载PDF
基于GBM的特征选择在心脏病预测中的研究 被引量:3
5
作者 刘云龙 周怡君 罗晨 《现代电子技术》 2023年第19期101-106,共6页
心脏病患者的人数逐年增多,死亡率居高不下,因此许多学者对基于机器学习的患病人群识别方法进行了研究,但由于心脏病数据的特征过多,构建的模型参数较多,往往导致训练时间过长。因此提出一种利用梯度提升机算法(GBM)对已有的特征选择算... 心脏病患者的人数逐年增多,死亡率居高不下,因此许多学者对基于机器学习的患病人群识别方法进行了研究,但由于心脏病数据的特征过多,构建的模型参数较多,往往导致训练时间过长。因此提出一种利用梯度提升机算法(GBM)对已有的特征选择算法进行改进,在通过减少特征数量实现缩短训练时间的同时,对心脏病患者的预测准确率也得到了提升。首先,采用遗传算法(GA)和基于相关性的特征选择(CFS)进行特征降维,并选出备选特征子集;其次,提出利用GBM实现对模型预测无关特征的筛除;最后,采用支持向量机(SVM)和K近邻算法(KNN)进行准确率预测。实验表明:当预测模型为SVM时,GBM对GA和CFS的综合评价指标的提升分别达到了9.89%和2.2%;当预测模型为KNN时,GBM对GA和CFS的综合评价指标的提升分别达到了7.7%和2.2%,并且GA+GBM在SVM上的表现最好,达到了84.62%,能够有效地提升医疗诊断的效率。 展开更多
关键词 特征选择 遗传算法 梯度提升机 支持向量机 CFS KNN 心脏病预测 BOOSTING
在线阅读 下载PDF
基于距离函数值和打分值的GBM算法预测酸根离子配体结合残基 被引量:1
6
作者 尤肖肖 胡秀珍 +4 位作者 孙锴 王子洋 徐爽 杨彩芸 郝四喜 《内蒙古工业大学学报(自然科学版)》 2021年第6期420-427,共8页
在生命活动中,酸根离子是一种重要的蛋白质配体,蛋白质与其结合才能发挥重要功能.因此,识别蛋白质-酸根离子配体结合位点具有重要的意义.选用SO_(4)^(2-),PO_(4)^(3-),CO_(3)^(2-)和NO_(2)^(-)配体作为研究对象,采用距离函数和矩阵打分... 在生命活动中,酸根离子是一种重要的蛋白质配体,蛋白质与其结合才能发挥重要功能.因此,识别蛋白质-酸根离子配体结合位点具有重要的意义.选用SO_(4)^(2-),PO_(4)^(3-),CO_(3)^(2-)和NO_(2)^(-)配体作为研究对象,采用距离函数和矩阵打分算法分别提取基础特征参数的组分信息和位置保守性信息,使用GBM算法对蛋白质-酸根离子配体结合残基进行预测.五交叉检验下得到较好的预测结果,其中CO_(3)^(2-)和NO_(2)^(-)配体结合残基识别要好于IonSeq方法的结果.为了进一步验证预测模型的实用性,我们选用了欠采样方法处理数据集,将同样的特征参数放入GBM算法中,独立检验结果好于随机森林算法和SMO算法的预测结果,也好于前人的预测结果. 展开更多
关键词 距离函数 矩阵打分算法 gbm算法 结合位点
在线阅读 下载PDF
基于优化的GBM算法识别金属离子配体结合残基
7
作者 徐爽 胡秀珍 +1 位作者 张晓瑾 孙锴 《内蒙古工业大学学报(自然科学版)》 2019年第5期328-339,共12页
金属离子配体具有体积小、灵活等特点,与蛋白质结合有着不同于其它配体的特殊性,因此准确的识别金属离子配体结合位点具有极强的挑战性.本文基于蛋白质的一级序列信息,选取了氨基酸及其物化特征、预测的二级结构信息为基础参数,利用离... 金属离子配体具有体积小、灵活等特点,与蛋白质结合有着不同于其它配体的特殊性,因此准确的识别金属离子配体结合位点具有极强的挑战性.本文基于蛋白质的一级序列信息,选取了氨基酸及其物化特征、预测的二级结构信息为基础参数,利用离散增量算法和位置权重矩阵打分算法将这些高维特征投影至20维的向量空间并作为预测特征参数输入优化的GBM算法中,对10种金属离子配体结合残基进行了5交叉检验预测,得到了好于前人的预测结果.结果发现:每种金属离子配体偏好的优化参数不同,优化的GBM算法能给出最佳的预测结果. 展开更多
关键词 金属离子配体 结合残基 gbm算法 最优算法参数
在线阅读 下载PDF
基于Light GBM与组合赋权的库存电表资产精益化管理
8
作者 杨玉 侯星晨 宋亚珍 《计算机时代》 2022年第1期64-67,共4页
为提高电能表库存资产管理水平,以某公司各县级库房为例,分析库房管理风险和资产账实风险。使用Light GBM算法建立异常资产识别模型,能在电能表计量数据中准确识别出异常的电表资产,准确度达91%,查全率为72%。构建库房风险评价指标体系... 为提高电能表库存资产管理水平,以某公司各县级库房为例,分析库房管理风险和资产账实风险。使用Light GBM算法建立异常资产识别模型,能在电能表计量数据中准确识别出异常的电表资产,准确度达91%,查全率为72%。构建库房风险评价指标体系,使用组合赋权评价库房管理风险,评价结果与预期一致。该方法可支撑库房资产盘点和库房管理绩效考核,提升库存管理的智能化程度。 展开更多
关键词 电能表 库存资产 Light gbm算法 组合赋权
在线阅读 下载PDF
基于近红外技术的道路线形认知实验研究
9
作者 赵微 陈雨人 《交通与运输》 2025年第1期72-75,共4页
为深入了解驾驶人在驾驶过程中对于道路线形的认知活动,通过功能性近红外光谱技术观测驾驶人前额叶皮层中氧合血红蛋白浓度变化开展自然驾驶实验研究:通过移动平均滤波器对前额叶皮层区域的4个通道信号进行滤波平滑处理;选择CatMull-Ro... 为深入了解驾驶人在驾驶过程中对于道路线形的认知活动,通过功能性近红外光谱技术观测驾驶人前额叶皮层中氧合血红蛋白浓度变化开展自然驾驶实验研究:通过移动平均滤波器对前额叶皮层区域的4个通道信号进行滤波平滑处理;选择CatMull-Rom三次样条曲线对视觉车道形态进行拟合并划分视觉车道区域,选取不同视野景深范围的曲线长度和视觉速度作为视觉车道线形特征,并进一步通过LightGBM算法进行数据建模。模型预测结果表明,左右两侧的道路近景曲线长度和左侧道路中景曲线长度对通道区域附近的驾驶人前额叶皮层中氧合血红蛋白浓度的影响较大,是影响驾驶人认知活动与执行功能最重要的道路线形特征。 展开更多
关键词 驾驶人认知 近红外光谱技术 样条曲线拟合 Lightgbm算法 道路安全
在线阅读 下载PDF
Boosting框架算法模型预测雷击火的适用性
10
作者 周暖阳 睢星 +6 位作者 赵凤君 杜建华 李笑笑 闫凯达 张师渊 李威 王京鲁 《陆地生态系统与保护学报》 2025年第2期47-62,共16页
【目的】旨在为我国雷击火发生最严重的大兴安岭林区筛选性能优良的雷击火发生预测模型,为该地区的雷击火精准防控提供科学支撑。【方法】采用大兴安岭林区2015—2023年的历史雷击火案例、气象因子、闪电、可燃物、火险天气指数等多源数... 【目的】旨在为我国雷击火发生最严重的大兴安岭林区筛选性能优良的雷击火发生预测模型,为该地区的雷击火精准防控提供科学支撑。【方法】采用大兴安岭林区2015—2023年的历史雷击火案例、气象因子、闪电、可燃物、火险天气指数等多源数据,运用机器学习方法构建雷击火发生概率模型;并通过对比基于Boosting框架算法(包括AdaBoost、GBM、XGBoost、LightGBM和CatBoost)的模型与其他常用模型(随机森林、决策树和深度神经网络)在雷击火预测性能上的差异,筛选最优的算法模型。【结果】首先,基于Boosting框架集成算法(除AdaBoost)的预测模型在准确率、查准率、召回率、F1值和ROC AUC等关键指标上优于其他常用模型。其次,在所有Boosting框架集成算法中,梯度提升机(Gradient Boosting Machines,GBM)表现最为优异,其准确率达到91%,F1值为0.7004,ROC AUC值为0.9329,表明其在预测雷击火发生概率方面具有较强的综合性能。在实际预测结果验证中,GBM的预测效果也是最优的。模型的特征重要性评估结果表明,空气相对湿度和森林火险天气指数在多个模型中都具有高的重要性,另外纬度也具有较高的重要性。【结论】Boosting框架的集成算法能够有效处理不平衡数据,提高对少数类样本(雷击火)的预测能力,相比于构建模型的其他算法,Boosting框架算法在构建雷击火发生预测模型中具有明显优势,特别是GBM。 展开更多
关键词 雷击火 Boosting框架算法 gbm 预测模型 大兴安岭
在线阅读 下载PDF
基于多形性胶质母细胞瘤的关键基因筛选研究
11
作者 夏苑 全海金 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第10期119-124,共6页
多形性胶质母细胞瘤(GBM)是一种最常见且致死率极高的脑部肿瘤.为了解决传统生存模型不能处理变量p远大于样本数n的基因表达数据的缺点,本文构建了一个关键基因筛选算法——SSLC算法.该算法结合限制性优化算法和生存模型筛选出了与生存... 多形性胶质母细胞瘤(GBM)是一种最常见且致死率极高的脑部肿瘤.为了解决传统生存模型不能处理变量p远大于样本数n的基因表达数据的缺点,本文构建了一个关键基因筛选算法——SSLC算法.该算法结合限制性优化算法和生存模型筛选出了与生存时间相关的GBM关键基因,并通过比较证明了此算法优于传统经典算法,最后通过文献查找证明筛选出的部分基因是已经证实的和GBM高度相关的基因,为GBM的靶向制药打下基础. 展开更多
关键词 gbm 生存模型 LASSO SPCA SSLC算法
原文传递
规模以下工业企业抽样调查的权数调整研究 被引量:2
12
作者 姜天英 金勇进 《工程数学学报》 CSCD 北大核心 2024年第2期199-216,共18页
为解决规模以下工业企业估计中的问题,对现有的权数调整范围进行了拓展,以期提高对规模以下工业企业的估计精度。一方面,解决目录企业的非自然消亡问题。分别讨论样本单元非自然消亡和样本层非自然消亡两种情况,将非自然消亡视为一种单... 为解决规模以下工业企业估计中的问题,对现有的权数调整范围进行了拓展,以期提高对规模以下工业企业的估计精度。一方面,解决目录企业的非自然消亡问题。分别讨论样本单元非自然消亡和样本层非自然消亡两种情况,将非自然消亡视为一种单元无回答,引入样本匹配方法,选择最为“相近”的正常上报企业与非自然消亡企业匹配,把非自然消亡的样本企业权数调整到正常上报的样本企业中。另一方面,解决非目录企业的估计偏差问题。分别讨论了基于超总体模型估计和倾向得分逆加权估计的权数调整思路,超总体模型估计选取了线性和非线性两种。倾向得分逆加权估计中,重点研究了倾向得分的求解,基于GBM(Generalized Boosted Model)算法,在其迭代求解过程中引入了权重,提出了w-GBM算法,同时提出将参数估计方法中的Logistic回归估计和非参数估计方法中的w-GBM算法或GBM算法进行加权的组合估计方法。实证结果表明,以上思路具有可行性。 展开更多
关键词 目录企业 非目录企业 权数调整 倾向得分 超总体模型 gbm算法
在线阅读 下载PDF
基于改进梯度提升算法的短期风电功率概率预测 被引量:19
13
作者 庞传军 尚学伟 +1 位作者 张波 余建明 《电力系统自动化》 EI CSCD 北大核心 2022年第16期198-206,共9页
随着风电大规模接入电网,风电功率概率预测的需求愈加迫切。为了实现短期风电功率概率分布预测,提出了一种基于改进梯度提升算法的短期风电功率概率预测方法。首先,分析了梯度提升算法应用于短期风电功率概率预测存在的问题。其次,利用... 随着风电大规模接入电网,风电功率概率预测的需求愈加迫切。为了实现短期风电功率概率分布预测,提出了一种基于改进梯度提升算法的短期风电功率概率预测方法。首先,分析了梯度提升算法应用于短期风电功率概率预测存在的问题。其次,利用负对数似然损失函数作为梯度提升算法中的损失函数,并利用费希尔信息矩阵修正损失函数在概率分布参数空间的梯度,将其转换为概率分布空间的自然梯度。然后,基于自然梯度提出适用于短期风电功率概率分布预测的改进梯度提升算法。最后,将所提算法与传统的梯度提升算法和其他算法进行对比,结果显示,所提算法训练过程收敛较快并且具有较好的预测性能,验证了其实用性和有效性。 展开更多
关键词 风电功率预测 费希尔信息 梯度提升算法 自然梯度 机器学习
在线阅读 下载PDF
偏移成像技术的研究现状和发展趋势——以射线束法在LD-A区域的应用为例 被引量:2
14
作者 魏天罡 吴奎 +3 位作者 吴俊刚 张中巧 王伟 何京 《海洋地质前沿》 2013年第8期60-68,共9页
偏移是一种提高地震资料空间分辨率的方法,它使倾斜反射界面归位,绕射波收敛。对偏移成像技术的研究现状进行了总结,包括主要的偏移方法(二维与三维偏移、叠后与叠前偏移、时间与深度偏移)和算法(克希霍夫积分偏移、频率波数域偏移、有... 偏移是一种提高地震资料空间分辨率的方法,它使倾斜反射界面归位,绕射波收敛。对偏移成像技术的研究现状进行了总结,包括主要的偏移方法(二维与三维偏移、叠后与叠前偏移、时间与深度偏移)和算法(克希霍夫积分偏移、频率波数域偏移、有限差分偏移);讨论了偏移成像技术的发展趋势,包括各向异性偏移、粘弹性偏移、真振幅偏移、速度综合建模及复杂地形条件下成像问题;并通过一个叠前深度偏移成像的实例验证了新技术在复杂构造条件下有很好的应用效果。 展开更多
关键词 偏移算法 各向异性模型 高斯射线束叠前深度偏移
在线阅读 下载PDF
阳极焙烧升温曲线的评估算法研究
15
作者 林满山 王雅楠 《计算机与数字工程》 2019年第10期2434-2437,共4页
预焙阳极焙烧升温阶段是阳极生产的重要阶段。为了对焙烧升温曲线进行评估,提出一种焙烧温度数据与焙烧块理化指标数据间的关系模型。该算法利用GRU处理时间序列的优势对温度数据进行处理,使用划分等级后投票的方式对质量数据进行处理,... 预焙阳极焙烧升温阶段是阳极生产的重要阶段。为了对焙烧升温曲线进行评估,提出一种焙烧温度数据与焙烧块理化指标数据间的关系模型。该算法利用GRU处理时间序列的优势对温度数据进行处理,使用划分等级后投票的方式对质量数据进行处理,从而达到辅助企业对升温过程进行良好评估的目的。首先使用GRU算法对温度数据所对应的阳极块成品质量进行预测,再使用GBM算法计算质量参数所对应的质量等级,根据计算出的质量指标数据类别进行验证。实验结果表明,该算法能够有效地对升温曲线进行评估。 展开更多
关键词 升温曲线 评估算法 GRU gbm
在线阅读 下载PDF
基于用户行为和智能算法的烟草精准营销系统设计
16
作者 刘海涛 《国外电子测量技术》 2026年第2期241-246,共6页
为提高烟草精准营销的准确性,提出一种基于用户行为与智能算法的烟草精准营销系统。该系统采用数据层、业务逻辑层、表示层及数据库4层结构,主要划分为功能管理、购销数据管理、精准营销3大核心模块,其中重点对精准营销模块进行了深化... 为提高烟草精准营销的准确性,提出一种基于用户行为与智能算法的烟草精准营销系统。该系统采用数据层、业务逻辑层、表示层及数据库4层结构,主要划分为功能管理、购销数据管理、精准营销3大核心模块,其中重点对精准营销模块进行了深化设计。在算法层面,系统以基于用户的协同过滤推荐算法为基础,通过引入差分进化算法改进的K-means算法以优化用户相似度计算,并引入LightGBM模型预测用户感兴趣偏好,从而构建出一套高效的基于用户行为和智能算法的推荐方法。仿真结果表明,所提方法的精确率、召回率和F 1值分别为98.47%、97.98%、98.09%;同时,所构建的烟草精准营销系统各功能模块完善,可高效实现用户管理、烟草营销数据管理和烟草精准营销等核心功能。改系统显著提高了烟草精准营销的准确性,为实现烟草供需的精准匹配及提高烟草市场运作效率提供了有力的技术支持。 展开更多
关键词 用户行为 协同过滤推荐 差分进化算法 K-means算法 Lightgbm模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部