-
题名基于知识先验和多通道注意力机制的生物活性预测模型
- 1
-
-
作者
李梦
唐文燕
-
机构
重庆工商大学数学与统计学院
统计智能计算与监测重庆市重点实验室
-
出处
《重庆工商大学学报(自然科学版)》
2026年第2期43-53,共11页
-
基金
重庆市自然科学基金面上项目资助(CSTC2020JCYJ-MSXMX0162).
-
文摘
目的针对现有药物研发中分子活性值预测不精、泛化性不高等问题,提出基于知识先验与注意力机制相结合的多通道语义深度神经网络,通过使用分子的SMILES(Simplified Molecular Input Line Entry System)表达式,预测雌激素受体α亚型(ERα)的pIC50生物活性值。方法该网络采用两阶段特征提取策略,在语义层设计了将知识先验与迁移学习结合的语义分析网络,它将分子SMILES、描述符和图表征的关键信息定位,通过在Erα数据集中微调参数,得到综合的分子SMILES表征信息;在通道层,基于高效通道注意力(Efficient Channel Attention,ECA)机制,设计了1D-ECA算法,将其嵌入CNN子模块中,构成多通道深度神经1D-ECA-CNN模块,实现分子表征的特征再提取,并减少分子表示学习过程中的信息损失;最后将语义层和通道层相结合形成KBAC(Knowledge-BERT-1D-ECA-CNN)深度神经网络,实现pIC50生物活性值的回归预测。结果实验结果表明:所提出的框架在4个评估指标上均表现优异,MAE可达0.091,MSE可达0.014,RMSE可达0.117,R^(2)可达0.993,相对于4个具有代表性的模型有较为明显的提升,说明所提模型具有更高的预测精度。结论该两阶段特征提取过程使其能够获取更为全面的分子特征,从而帮助筛选治疗疾病的候选药物。
-
关键词
SMILES
knowledge-bert
多通道注意力机制
KBAC
pIC50预测
-
Keywords
SMILES
knowledge-bert
multi-channel attention mechanism
KBAC
pIC50 prediction
-
分类号
R9
[医药卫生—药学]
-