基于序列与结构域相似性的蛋白质直系同源聚类研究被引量：2

Clustering orthologs based on sequence and domain similarites

下载PDF

导出

摘要目的探讨直系同源蛋白质聚类分析的方法,为高效、快速的直系同源蛋白质聚类分析研究提供有效帮助。方法基于蛋白质序列的相似性和结构域的相似性,提出一种直系同源蛋白质聚类方法,实现了直系同源蛋白质的快速、精确聚类。结果对人类、酵母、蠕虫、果蝇、拟南芥和斑马鱼等六种真核生物序列直系同源蛋白质的聚类分析,结果明显优于NCBI和TIGR的聚类结果。结论利用蛋白质序列的相似性和结构域的相似性,可以有效筛选出假的同源关系,进而显著提高直系同源蛋白聚类的精确性和紧密性。 [ Objective ] To investigate the methods of orthologs clustering analysis, and provide a notion for auto- matic and robust clustering analysis of orthologs. [Methods] Based on the similarities of sequences and domains, a method to cluster orthologs was presented, which could automatic cluster orthologs from multiple species. [ Results ] Analysis on six completely sequenced eukaryotic genomes showed that a significant improvement of our clustering results compared with those by NCBI and TIGR. [ Conclusion ] It suggests that using the similarities of sequences and domains can filter the false homology relationships and improve the accuracy and robustness of orthologs cluster- ing.

作者任菲张法张阳德

机构地区中南大学卫生部肝胆肠外科研究中心中国科学院计算技术研究所

出处《中国现代医学杂志》 CAS CSCD 北大核心 2012年第27期15-18,共4页 China Journal of Modern Medicine

关键词结构域同源直系聚类真核生物 domain orthologs clustering eukaryotic

分类号 R34 [医药卫生—基础医学] Q51 [生物学—生物化学]

引文网络
相关文献

参考文献13

1GALPERIN MY, KOONIN EV. Who's your neighbor new computational approaches for functional genomics[J]. Nature. Biotechnology, 2000, 18(6): 609-613.
2TEKAIA F, YERAMIAN E. SuperPartitions: detection and classification of orthologs[J]. Gene, 2012, 492(1): 199-211.
3SALICHOS L, ROKAS A. Evaluating ortholog prediction algorithms in a yeast model clade [J]. PLoS One, 2011, 6(4): e18755.
4GREENE LH, LEWIS TE, ADDOU S, et al. The CATH domain structure database: new protocols and classification levels give a more comprehensive resource for exploring evolution [J]. Nucleic Acids Research, 2008, 35: D291-D297.
5SCHAFFER AA, ARAVIND L, MADDEN TL, et al. Improving the accuracy of PSI-BLAST protein database searches with composition-based statistics and other refinements [J]. Nucleic Acids Research, 2001, 29(14): 2994-3005.
6KIM K, KIM W, KIM S. ReMark: an automatic program for clustering orthologs flexibly combining a Recursive and a Markov clustering algorithms[J]. Bioinformatics, 2011, 27(12): 1731-1733.
7EDGAR RC, SJOLANDER K. COACH: profile-profile alignment of protein families using hidden Markov models[J]. Bioinformatics, 2004, 20(8): 1309-1318.
8HARRIS MA. The Gene Ontology (GO) database and informatics resource[J]. Nucleic Acids Research, 2004, 32: D258-D261.
9TATUSOV RL, FEDOROVA N D, JACKSON JD, et al. The COG database: an updated version includes eukaryotes [J]. BMC Bioinformatics, 2003, 11(4): 41.
10LEE Y, SULTANA R, PERTEA G, et al. Cross-referencing eukaryotic genomes: TIGR Orthologous Gene Alignments (TOGA)[J]. Genome Research, 2002, 12(3): 493-502.

同被引文献29

1宋玉溪,赵新利.蛹虫草的研究开发进展[J].河南农业,2007(21):44-44. 被引量：5
2宋金俤,刘超,华秀红,林金盛.蛹虫草产业化栽培瓶颈及其对策[J].中国食用菌,2009,28(1):62-64. 被引量：19
3中华人民共和国卫生部公告(2009年第3号)[J].中华人民共和国卫生部公报,2009(5):21-22. 被引量：6
4Xuan Yao,Hong Ma,Jian Wang,Dabing Zhang.Genome-Wide Comparative Analysis and Expression Pattern of TCP Gene Families in Arabidopsis thaliana and Oryza sativa[J].Journal of Integrative Plant Biology,2007,49(6):885-897. 被引量：59
5张文力.高通量测序数据分析现状与挑战[J].集成技术,2012,1(3):20-24. 被引量：21
6何云贵,房海燕,夏昆,夏家辉.DNA循环测序中一些常见影响因素的研究[J].中华医学遗传学杂志,2000,17(2):122-124. 被引量：4
7刘洋,张慧,辛大伟,王琳琳,张丽伟,刘春燕,陈庆山,胡国华.大豆TCP转录因子家族结构域分析及功能预测[J].大豆科学,2012,31(5):707-713. 被引量：15
8张颖,王海燕.蛹虫草不同菌株栽培的比较试验[J].农业技术与装备,2013(4):31-32. 被引量：3
9张姝,张永杰,SHRESTHA Bhushan,徐建平,王成树,刘杏忠.冬虫夏草菌和蛹虫草菌的研究现状、问题及展望[J].菌物学报,2013,32(4):577-597. 被引量：132
10殷东林,段鸿斌,王锐丽.蛹虫草有性生殖研究[J].北方园艺,2014(3):130-133. 被引量：4

引证文献2

1连卜颍,王喆,韩尚玲,侯思宇,韩渊怀,李红英.谷子TCP基因家族成员序列特征及表达模式分析[J].分子植物育种,2020,18(3):710-718. 被引量：7
2李敬,罗俊杰,方祥娜,张莹,吴琼,陈依婷,贺斌,刘新平.蛹虫草菌基因组生物信息学分析[J].微生物前沿,2020,9(2):51-59. 被引量：2

二级引证文献9

1张志强,卢世雄,马宗桓,周琪,何红红,陈佰鸿,毛娟.草莓TCP转录因子家族生物信息学鉴定及基因表达分析[J].西北植物学报,2020,40(12):2031-2043. 被引量：13
2张得芳,夏涛.基于转录组的唐古特白刺密码子偏好性分析[J].干旱区资源与环境,2021,35(12):163-170. 被引量：7
3孙颖琦,孟亚轩,赵心月,王凤霞,瓮巧云,赵治海,刘颖慧,袁进成.谷子bHLH转录因子家族基因鉴定及生物信息学分析[J].种子,2021,40(12):45-55. 被引量：6
4阚宝林,杨勇,杜鹏萌,李信平,来文杰,胡海燕.香蕉TCP家族的全基因组鉴定及对低氮胁迫的响应[J].分子植物育种,2022,20(1):64-75. 被引量：5
5李剑梅,冯敏,谢存一,柴林山,朱万芹,张疏雨.不同组织分离期对大圆头蛹虫草菌种性能的影响[J].微生物学杂志,2021,41(6):111-116. 被引量：2
6王智兰,韩康妮,杜晓芬,李禹欣,连世超,王军.谷子GRAS转录因子家族的全基因组鉴定、表达分析及标记开发[J].核农学报,2022,36(9):1723-1737. 被引量：6
7李艳鹏,魏娜,翟庆妍,李杭,张吉宇,刘文献.全基因组水平白花草木樨TCP基因家族的鉴定及在干旱胁迫下表达模式分析[J].草业学报,2023,32(4):101-111. 被引量：5
8王卓依,邱佳琪,张颖,俞蕾,刘良淼,李永强,陈文荣,郭卫东,杨莉.高丛蓝莓细胞色素CYP81家族的鉴定及表达分析[J].分子植物育种,2025,23(2):387-395.
9李海伦,高宁宁,郭姚淼,孙东玲,王月玲,谢夔熙,李鹏飞,段世享,赵卫星,杨森.甜瓜TCP基因家族全基因组的鉴定与表达分析[J].河南农业科学,2025,54(9):127-140.

1路纪琪.河南省啮齿动物地理分布的聚类研究[J].生态学杂志,2000,19(4):43-45. 被引量：9
2裘聿皇.我国草兔的聚类研究[J].兽类学报,1989,9(3):168-172. 被引量：5
3李树恒.重庆市凤蝶科昆虫地理分布的聚类研究[J].四川动物,2001,20(4):201-204. 被引量：9
4达尔文的祖先是何许人[J].阅读与作文（英语高中版）,2010(7):51-52.
5路纪琪,吕九全,瞿文元.河南省两栖动物地理分布的聚类研究[J].四川动物,1999,18(3):137-139. 被引量：7
6李海渤,唐志明,任安祥,马崇坚,王玉珍.用RAPD标记分析辣木的遗传多样性[J].江苏农业科学,2009,37(1):49-51. 被引量：7
7冼英杰,陈彩蓉,梁小青,颜秋霞,黄茂萍,周秀琴,赵晓英,郭晓燕,李介华.继续囊胚培养筛选非优质胚胎中具有发育潜能胚胎的可行性研究[J].齐齐哈尔医学院学报,2014,35(18):2662-2664. 被引量：6
8艾尼瓦尔.吐米尔,张大铭.新疆北部啮齿动物地理分布的聚类研究[J].生物学杂志,2002,19(4):22-23. 被引量：1
9戴静珠,李霞.直系同源蛋白在蛋白质互作网络中的特性及其受到microRNA调控的特点研究[J].中国优生与遗传杂志,2009,17(3):9-11.
10徐剑.广东爬行动物地理分布的聚类分析[J].四川动物,2007,26(4):837-840. 被引量：2

中国现代医学杂志

2012年第27期

浏览历史

内容加载中请稍等...

基于序列与结构域相似性的蛋白质直系同源聚类研究被引量：2

参考文献13

同被引文献29

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于序列与结构域相似性的蛋白质直系同源聚类研究 被引量：2

参考文献13

同被引文献29

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于序列与结构域相似性的蛋白质直系同源聚类研究被引量：2