期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Improving Protein Sequence Classification Performance Using Adjacent and Overlapped Segments on Existing Protein Descriptors
1
作者 Mohammad Reza Faisal Bahriddin Abapihi +6 位作者 Ngoc Giang Nguyen Bedy Purnama Mera Kartika Delimayanti Dau Phan Favorisen Rosyking Lumbanraja Mamoru Kubo Kenji Satou 《Journal of Biomedical Science and Engineering》 2018年第6期126-143,共18页
In protein sequence classification research, it is popular to convert a variable length sequence of protein into a fixed length numerical vector by using various descriptors, for instance, composition of k-mer composi... In protein sequence classification research, it is popular to convert a variable length sequence of protein into a fixed length numerical vector by using various descriptors, for instance, composition of k-mer composition. Such position-independent descriptors are useful since they are applicable to any length of sequence;however, positional information of subsequence is discarded even though it might have high contribution to classification performance. To solve this problem, we divided the original sequence into some segments, and then calculated the numerical features for them. It enables us to partially introduce positional information (for instance, compositions of serine in anterior and posterior segments of a sequence). Through comprehensive experiments on the number of segments and length of overlapping region, we found our classification approach with sequence segmentation and feature selection is effective to improve the performance. We evaluated our approach on three protein classification problems and achieved significant improvement in all cases which have a dataset with sufficient amino acid in each sequence. This result has shown the great potential of using additional segments in protein sequence classification to solve other sequence problems in bioinformatics. 展开更多
关键词 protein SEQUENCE Classification protein descriptor SEQUENCE Segmentation Feature Selection
暂未订购
人工智能驱动的蛋白质结构预测进展与应用前景
2
作者 朱吕帅 李志鹏 +1 位作者 刘欣悦 叶盛 《生物学杂志》 北大核心 2025年第5期1-9,共9页
蛋白质是生命活动的核心分子,其三维结构决定了其生物功能与作用机制。尽管X射线晶体学、核磁共振和冷冻电镜等实验方法在结构解析方面取得了丰硕成果,但仍面临成本高、耗时长和适用性受限的挑战。近年来,人工智能尤其是深度学习技术的... 蛋白质是生命活动的核心分子,其三维结构决定了其生物功能与作用机制。尽管X射线晶体学、核磁共振和冷冻电镜等实验方法在结构解析方面取得了丰硕成果,但仍面临成本高、耗时长和适用性受限的挑战。近年来,人工智能尤其是深度学习技术的飞速发展,为蛋白质结构预测带来了革命性突破。从早期的统计能量函数和同源建模,到融入注意力机制和大规模参数化网络的前沿深度学习模型,预测精度与速度均得到了显著提升。以AlphaFold和RoseTTAFold为代表的算法不仅在静态结构预测上屡创佳绩,还在变异体筛选、药物设计和精准医学等领域展现出广阔应用前景。此外,还系统阐述了基于蛋白质语言模型(如ESM-3)的结构预测方法,同时进一步探讨了基于光谱描述符和基于大规模生物物理采样增强的深度学习这两类探索性动态结构预测策略,并评估了它们的研究进展与应用潜力,为未来研究提供理论与实践参考。 展开更多
关键词 蛋白质结构预测 人工智能 AlphaFold RoseTTAFold ESM-3 光谱描述符
在线阅读 下载PDF
基于深度神经网络和局部描述符的大规模蛋白质互作预测方法 被引量:2
3
作者 桂元苗 王儒敬 +1 位作者 王雪 魏圆圆 《计算机应用与软件》 北大核心 2019年第4期273-280,共8页
蛋白质相互作用PPI(Protein-Protein Interaction)是生物体中众多生命活动过程的重要组成部分,蛋白质互作预测是研究蛋白质互作的重要途径。为了提高蛋白质互作预测性能,构建一个用于预测蛋白质互作的深度神经网络模型DPPI。采用局部描... 蛋白质相互作用PPI(Protein-Protein Interaction)是生物体中众多生命活动过程的重要组成部分,蛋白质互作预测是研究蛋白质互作的重要途径。为了提高蛋白质互作预测性能,构建一个用于预测蛋白质互作的深度神经网络模型DPPI。采用局部描述符将氨基酸序列编码成具鉴别性的特定维数向量;使用训练集训练DPPI模型,并使用测试集对DPPI模型进行测试和评价;根据测试和评价的结果调整各参数,优化DPPI模型;使用优化后的DPPI模型,来对蛋白质互作进行预测。结果表明,DPPI模型编码简单、代码简洁,实验获得的较高的准确率,可以作为大规模蛋白质互作预测的有益补充。 展开更多
关键词 深度神经网络 局部描述符 蛋白质互作
在线阅读 下载PDF
蛋白质序列的图形表示及其应用 被引量:2
4
作者 张艳萍 贺平安 《浙江理工大学学报(自然科学版)》 2010年第2期308-312,共5页
基于DNA序列的chaos game representation(CGR)图形表示,文中给出了一种新的蛋白质序列的3D空间表示,其空间曲线的x、y轴坐标由Randic文章中的方法得到,z轴坐标由蛋白质序列中氨基酸的累积个数得到。蛋白质序列的3D空间表示得到的曲线比... 基于DNA序列的chaos game representation(CGR)图形表示,文中给出了一种新的蛋白质序列的3D空间表示,其空间曲线的x、y轴坐标由Randic文章中的方法得到,z轴坐标由蛋白质序列中氨基酸的累积个数得到。蛋白质序列的3D空间表示得到的曲线比Randic的2D图形表示具有更好的可视性。利用不同的数学方法,对所得到的曲线进行了数值刻画;基于得到的数值刻画,比较了9个不同物种的线粒体NADH脱氢酶的相似性。 展开更多
关键词 图形表示 CGR 蛋白质序列 数学描述
在线阅读 下载PDF
蛋白质序列的图形表示及相似性分析
5
作者 强静 贺平安 《浙江农业学报》 CSCD 北大核心 2010年第5期673-677,共5页
基于20个氨基酸的3个理化性质,给出了一种蛋白质序列的三维图形表示。在此基础上,进一步利用数学方法对所得到的蛋白质序列曲线进行了数值刻画;最后,基于这种数学描述,对9个不同物种的线粒体NADH脱氢酶进行了相似性分析。
关键词 蛋白质序列 图形表示 数学描述 相似性分析
在线阅读 下载PDF
人工智能辅助的蛋白质工程 被引量:9
6
作者 卞佳豪 杨广宇 《合成生物学》 CSCD 2022年第3期429-444,共16页
蛋白质工程是合成生物学领域的重要研究方向之一。但目前人类对于蛋白质折叠、酶天然进化机制等基础生物学问题的理解仍很有限,因此基于理性设计方法进行蛋白质的功能从头设计(denovo design)仍然是一个难题。定向进化(directedevoluti... 蛋白质工程是合成生物学领域的重要研究方向之一。但目前人类对于蛋白质折叠、酶天然进化机制等基础生物学问题的理解仍很有限,因此基于理性设计方法进行蛋白质的功能从头设计(denovo design)仍然是一个难题。定向进化(directedevolution)通过在实验室模拟自然进化的原理,可以在不依赖结构和机制信息的基础上对蛋白质的功能进行有效优化。但是定向进化高度依赖高通量筛选方法,也限制了其对缺少高通量筛选方法的蛋白质进行改造的能力。近年来,人工智能辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略,在蛋白质的结构预测、功能预测、溶解度预测和指导智能文库设计等多个方面显现出独特的优势,成为理性设计和定向进化之后的又一次技术发展的浪潮。本文综述了近年来人工智能辅助的蛋白质工程的应用进展,对其中的代表性工作进行了重点阐述。在简单介绍了人工智能蛋白质工程策略的原理和流程之后,对数据、分子描述符和人工智能算法等三个影响预测模型性能的关键点进行了分析,总结了该策略中的主要数据库、分子描述符和算法的主流工具包及平台,介绍了它们的功能、用途和网址。我们还对人工智能策略目前仍面临的不足进行了探讨,如高质量数据不足、实验数据存在偏差、缺少通用模型等。随着自动基因功能注释技术、超高通量筛选技术和人工智能算法的不断发展,将会给人工智能辅助的蛋白质工程提供足够的高质量数据和更准确的算法,从而不断提升人工智能辅助的蛋白质工程预测准确度,为合成生物学研究提供更大的助力。 展开更多
关键词 蛋白质工程 合成生物学 人工智能 预测模型 数据库 分子描述符
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部