-
题名基于关键字树的生物基因多序列比对并行计算方法
- 1
-
-
作者
徐胜超
-
机构
广州华商学院人工智能学院
-
出处
《计算机与数字工程》
2025年第7期1789-1793,1799,共6页
-
基金
国家自然科学基金面上项目(编号:61972444)资助。
-
文摘
针对传统星比对算法的生物基因多序列比对时间复杂度为平方级别问题,引入关键字树算法对星比对算法进行改进。分割生物基因序列,并生成各子序列的关键字树;利用滑动窗口法在序列的关键字树中搜索与其他序列具有完全匹配碱基对最多的一个序列,设这个序列为中心序列,将该中心序列与其他序列两两比对,得到最终的多序列比对结果。运用Apache Hadoop Yarn云平台对改进星比对算法进行并行化处理,提升算法比对速度。测试结果表明,改进后的星比对算法能够显著提升比对的速度,并且Apache Hadoop Yarn云平台并行的结果十分优秀,在改进后的星比对算法之上通过并行化处理再次降低序列比对时间。
-
关键词
关键字树
星比对算法
生物信息学
碱基对
多线程
-
Keywords
keyword tree
star comparison algorithm
bioinformatics
base pairm
multithreading
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-