基于密度K中心方法的核酸序列聚类

Cluster of Nucleic Acid Sequences Based on Density K-medoids Method

下载PDF

导出

摘要针对传统K中心聚类算法存在的初始化敏感、聚类结果多样化等问题,提出一种基于密度的K中心聚类方案,并与序列比对、动态规划等方法有机地融合在一起,实现了对核酸序列的聚类分析。实验表明,该方案与传统K中心聚类算法相比较,初始化较理想,迭代次数较少,聚类效果更优。 Due to the disadvantages of initialization and result in the K-medoids clustering algorithm, a new density-based K-medoids clustering is described. And it combines sequence alignment, dynamic programming and other theories, accomplishes the clustering analysis in the nucleic acid sequences. Experiments prove that this method has better initialization, less iterative times and satisfying results compared with the ordinary K-medoids clustering.

作者赵友杰曹永忠张剑峰陆王红

机构地区扬州大学信息工程学院扬州大学科研处

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第19期280-282,共3页 Computer Engineering

基金科技部"新城疫防制技术平台"基金资助项目江苏省动物预防医学重点实验室开放课题资助项目(K04005)

关键词 K中心聚类直接密度可达序列比对动态规划生物信息学 K-medoids cluster Direct arrived density Sequence alignment Dynamic programming Bioinformatics

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Baxevanis A D.The Molecular Biology Database Collection:2003 Update[J].Nucleic Acids Res.,2003,31 (1):1-12.
2Discala C.DBcat:A Catalog of 500 Biological Databases[J].Nucleic Acids Res.,2000,28(1):8-9.
3李衍达孙之荣.生物信息学:基因和蛋白质分析的实用指南[M].北京:清华大学出版社,2000.70-84.
4王敞,陈增强,孙青林,袁著祉.基于K中心方法的氨基酸序列聚类分析[J].计算机工程,2003,29(8):42-43. 被引量：1
5张白妮,骆嘉伟,汤德佑.基于比对相似度动态矩阵聚类算法在基因序列中的应用[J].计算机应用,2004,24(8):35-37. 被引量：1
6Saitou N,Nei M.The Neighbor-joining Method:A New Method for Reconstructing Phylogenetic Trees[J].Mol.Biol.Evol.,1987,4(4):406-425.

二级参考文献16

1[1]Henikoff S, Henikoff J G. Quantitative Comparative Research of the Similarity of Amino Acid Sequences. In Proceedings of the 89th National Academic Science Conference of USA. New York, 1992-10: 915-919
2[2]Han J,Kamber M.Data Miniing:Concepts and Techniques.The Morgan Kaufmann Series in Data Management System. Jim Gray:Morgan Kaufmann Publishing,2001
3[3]Dayhoff M O, Schwartz R M, Orcutt B C. A Model of Evolutionary Change in Proteins,in Atlas of Protein Sequences and Structure. Washing DC:National Biomedical Research Foundation,1978:345-358
4[4]Jain A K,Murty M N,Flynn P J.Data Clustering:A survey.ACM Computer Survey,1999-2
5[5]Bellman R.Dynamic Programming Treatment of the Traveling Salesm- an Problem.Journal of the ACM,1962-1
6[6]Zhang Chunting.The Current Status and The Prospect of Bioinform- atics.http://tubic.tju.edu.cn,2002
7[1]Yona G, Linial N, Linial M. ProtoMap:automatic classification of protein sequences,a hierarchy of protein families,and local maps of the protein space[J]. Proteins:Structure,Function and Genetics,1999,37(3):360-378.
8[2]Abascal F, Valencia A. Clustering of proximal sequence space for the identification of protein families[J]. Bioinformatics,2002,18(7):908-921.
9[3]Liu HA, Califano A. CASTOR:clustering algorithm for sequence taxonomical organization and relationships[J]. Journal of Computational Biology ,2003,10(1):21-45.
10[4]Enright AJ, Ouzounis CA. GeneRAGE:a robust algorithm for sequence clustering and domain detection[J].Bioinformatics,2000,16(5):451-457.

共引文献7

1张跃新,刘妍,刘开泰,成军,陈新华,王国荃.砷诱导人T淋巴细胞表达HMG2基因的克隆研究[J].地方病通报,2004,19(1):1-4. 被引量：1
2吴顺华,郑玉建,张跃新,成军,刘开泰,王国荃.砷诱导Jurkat T淋巴细胞铁蛋白重链的表达[J].中国公共卫生,2005,21(6):673-674. 被引量：1
3刘友生,王长松,陈燕平.运用生物信息学技术分析预测抗氨基末端脂多糖结合蛋白(NH-LBP)单链抗体的结构[J].药物生物技术,2006,13(6):399-401.
4陈保锋,梁素华,章欢,曾梅,刘云.甲基乙二醛诱导牙周膜成纤维细胞基因表达与分析[J].江西科学,2010,28(4):461-465.
5夏志,刘小林,郭家中,徐阿娟.奶牛CRP基因SNP的生物信息学分析[J].生物信息学,2011,9(1):10-15. 被引量：2
6郑国清,张瑞玲,段韶芬,徐丽敏.生物信息学的形成与发展[J].河南农业科学,2002,31(11):4-7. 被引量：13
7肖维威,马文丽,马晓冬,毛向明,郑文岭.登革病毒cDNA的生物信息学分析及其Oligo探针设计[J].第一军医大学学报,2003,23(9):905-907. 被引量：4

1穆瑞辉.基于粒子群优化的目标分类算法[J].新乡学院学报,2013,30(4):277-279. 被引量：1
2陈婉.云计算环境下虚拟化数据中心融合技术[J].软件导刊,2016,15(4):166-168. 被引量：3
3曾黄麟,袁慧,刘小芳.模糊中心聚类的模式识别学习方法[J].中国工程科学,2004,6(11):33-37. 被引量：1
4符保龙,张爱科.中心聚类和语义特征融合的网页信息文本挖掘方法[J].辽宁工程技术大学学报（自然科学版）,2016,35(1):85-88. 被引量：2
5刘波,王洪建.并行遗传算法的迁移策略对K-中心聚类的影响[J].重庆工商大学学报（自然科学版）,2005,22(3):285-288.
6曾超群,李文科,张刚华.一种改进的k-中心聚类算法研究[J].电脑与信息技术,2010,18(2):45-48.
7张涤,杨燕,唐瑞雪.基于文化算法的混合聚类方法[J].计算机工程与应用,2009,45(4):159-161. 被引量：4
8张宏兵,陆建峰,汤九斌.一种基于近似EMD的DBSCAN改进算法[J].山东大学学报（工学版）,2012,42(4):35-40. 被引量：5
9何飞,梁治国,王晓晨,马粹.基于流形距离的生产状态聚类分析[J].计算机应用研究,2011,28(9):3242-3244. 被引量：1
10付立东.中心方法在复杂网络中的比较[J].西安科技大学学报,2010,30(1):107-111. 被引量：3

计算机工程

2006年第19期

浏览历史

内容加载中请稍等...

基于密度K中心方法的核酸序列聚类

参考文献6

二级参考文献16

共引文献7

相关作者

相关机构

相关主题

浏览历史