优化GBM算法预测蛋白质-HEME结合残基

The GBM algorithm was optimized to predict protein-HEME binding residues

下载PDF

导出

摘要为了提升蛋白质-HEME结合残基的预测精度,本文基于Gradient Boosting Machine(GBM)算法,重点优化了其内置参数,包括最小训练样本数(minobsinnode)、决策树深度(depth)、迭代次数(n.trees)和学习速率(shrinkage)。通过总结数据科学竞赛中的经验,调整最优扰动权重和参数配置,成功避免过拟合问题,并实现了更高的预测精确度。在此基础上,改进采样方法以克服样本不平衡问题,结合五折交叉检验与独立检验对模型进行全面优化。 To improve the prediction accuracy of protein-HEME binding residues,this study focuses on optimizing the built-in parameters of the Gradient Boosting Machine(GBM)algorithm,including the minimum number of training samples per node(minobsinnode),tree depth(depth),number of iterations(n.trees),and learning rate(shrinkage).By leveraging insights from data science competitions,optimal perturbation weights and parameter configurations were adjusted to successfully avoid overfitting and achieve higher prediction precision.Furthermore,improved sampling methods were employed to address class imbalance issues,and the model was comprehensively refined through five-fold cross-validation and independent testing.

作者郭国栋潘星宇白云霞包梦雪李彩艳 GUO Guodong;PAN Xingyu;BAI Yunxia;BAO Mengxue;LI Caiyan(School of Computer Science and Technology,Baotou Medical College,Baotou,Inner Mongolia 014000,China;School of Humanities,Baotou Medical College,Baotou,Inner Mongolia 014000,China)

机构地区包头医学院计算机科学与技术学院包头医学院人文学院

出处《中国科技论文在线精品论文》 2025年第2期198-200,共3页 Highlights of Sciencepaper Online

基金包头医学院科学研究基金项目(秦文斌基金项目)(BYJJ-QWB-202306) 内蒙古大学生创新创业训练计划项目(NO.S202510130021)。

关键词生物物理学 GBM算法 Heme残基加权采样法 biophysics GBM algorithm heme residue weighted sampling method

分类号 Q75 [生物学—分子生物学]

引文网络
相关文献

参考文献1

1李彩艳,马勇,邢俊凤,郭国栋,武一凡,闻昊坤,丁海麦,张改梅.基于氨基酸组分和位点保守信息识别蛋白质⁃HEME结合残基[J].生物信息学,2022,20(3):189-194. 被引量：2

二级参考文献3

1SarahMMense.Heme:a versatile signaling molecule controlling the activities of diverse regulators ranging from transcription factors to MAP kinases[J].Cell Research,2006,16(8):681-692. 被引量：7
2姜雪,胡秀珍.打分矩阵方法在β-发夹模体识别中的应用[J].生物信息学,2008,6(4):156-158. 被引量：6
3王春连,张晓东.基于打分矩阵的多类蛋白质折叠子的预测[J].生物信息学,2011,9(1):42-45. 被引量：3

共引文献1

1张志旺,高坤,蔡奕.基于Fisher判别法区分两种β-Loop-β蛋白质模体[J].中国科技论文在线精品论文,2025,18(4):322-324.

1凤舞剑,陶佩琳,王婷婷,白耀博,赵虎.谷子CNGC家族全基因组鉴定及胁迫响应分析[J].核农学报,2025,39(10):2114-2124.
2赵辉,代永强.多策略改进浣熊优化算法[J].软件工程,2025,28(7):9-15.
3占丽华.拯救大盐湖[J].疯狂英语(新策略),2025(7):58-60.
4范江琳,龙柯吉,曹萍萍,彭爽,吴薇.多源融合格点降水产品在四川复杂地形区域的检验评估[J].陕西气象,2025(5):23-32.
5曹蕙如.基于学科竞赛的应用型本科高校专业实践课教学模式重构研究[J].湖北画报(下半月),2025(4):228-230.
6陈德海,龚浩,李志军,曾庆宇.基于改进RBF神经网络和扰动前馈的PMSM双自适应滑模控制[J].科学技术与工程,2025,25(25):10709-10718.
7张春光,赵晴,姚可筠.基于BP神经网络的电力设备台风灾损故障预测[J].计算机仿真,2025,42(8):449-452.
8刘田双,谭勇,樊冬冬,赵帅,郝忠杰.基于GRU算法的长距离矩形顶管顶进力智能预测[J].广西大学学报(自然科学版),2025,50(4):701-711. 被引量：1
9吴欣隆,郑德生,李政禹,温冬,殷光强,周永.基于自动扰动策略的静态恶意样本生成模型[J].计算机应用与软件,2025,42(8):350-356.
10杨荃,杨晓春,王一格,魏俊涛.西安市气象-水文雨量信息融合试验分析[J].陕西气象,2025(5):49-55.

中国科技论文在线精品论文

2025年第2期

浏览历史

内容加载中请稍等...

优化GBM算法预测蛋白质-HEME结合残基

参考文献1

二级参考文献3

共引文献1

相关作者

相关机构

相关主题

浏览历史