期刊文献+

融合多实例学习与注意力机制的异构体功能预测方法

Isoform function prediction based on attention mechanism and multiple instance learning
在线阅读 下载PDF
导出
摘要 基因功能的高分辨率注释是功能基因组学的核心任务。单个基因可变剪接产生的异构体(isoform)翻译出多种蛋白质变体,为生物体提供了功能多样性。为实现异构体功能的高分辨率注释,本文提出了一种方法LossIsoFun。引入基因本体(gene ontology,GO),并利用图卷积神经网络(graph convolutional network,GCN)保留其层次结构和语义信息,通过GO网络嵌入策略获得压缩的基因GO注释。融合异构体互作网络、共表达网络和序列相似性网络,构建异构体功能网络,并将异构体序列数据与功能网络输入GCN,获取异构体功能的低维表示。通过基因与异构体的关联关系,得到基因功能的低维表示。提出一种基于注意力权重的损失函数,通过最小化压缩的基因GO注释与基因功能低维表示之间的差异来训练模型。通过解压缩异构体的低维表示,获得异构体的高分辨率注释。在人类基准数据集上的对比实验验证了LossIsoFun的有效性。 High-resolution annotation of gene functions is essential in functional genomics.Multiple isoforms are generated from a single gene via alternative splicing,thereby producing protein variants that contribute to functional diversity.This paper introduces LossIsoFun,a framework for high-resolution isoform function annotation.First,gene ontology(GO)and a graph convolutional network(GCN)are used to preserve hierarchical and semantic structures,producing compressed GO annotations.Then,isoform interaction,coexpression,and sequence similarity networks are integrated to construct an isoform functional network.The isoform sequence data and functional network are fed into a GCN to generate low-dimensional isoform representations.By leveraging gene–isoform relationships,gene function representations are derived.A novel loss function minimizes differences between compressed GO annotations and gene function representations.Finally,isoform functions are annotated by decompressing these representations.Validation on human benchmark datasets demonstrates that LossIsoFun effectively yields isoform function annotation.
作者 郭茂祖 周遨宇 段然 GUO Maozu;ZHOU Aoyu;DUAN Ran(School of Intelligence Science and Technology,Beijing University of Civil Engineering and Architecture,Beijing 102616,China;Beijing Key Laboratory of Super Intelligent Technology for Urban Architecture,Beijing University of Civil Engineering and Architecture,Beijing 102616,China)
出处 《智能系统学报》 北大核心 2025年第6期1508-1519,共12页 CAAI Transactions on Intelligent Systems
基金 国家自然科学基金重点项目(62031003) 国家自然科学基金青年基金项目(62301021)。
关键词 基因功能 高分辨率注释 异构体功能 图卷积神经网络 基因本体嵌入 异构体互作网络 融合网络 注意力权重 损失函数 gene functions high-resolution annotation isoform functions graph convolutional network gene ontology embedding isoform interaction network fusion network attention-weighted loss function
  • 相关文献

参考文献1

二级参考文献4

共引文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部