基于多维伪F统计量的基因表达动态聚类分析方法研究被引量：12

Study on Dynamic Clustering Analysis Method for Gene Expression Data Based on Multidimension Pseudo F-statistics

下载PDF

导出

摘要 K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K,基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表达动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量。 K-means clustering analysis algorithm is a widely iterated algorithm in clustering analysis ofgene expression data. In this algorithm, cluster number is assumed to be K and iterated methods are employed to make the value of objective function minimum. By doing so, the cluster result improves very much. However K-means clustering analysis algorithm depends on parameters strongly and the cluster number keeps unchanged.. Fake F-statistic and an idea of adjusting cluster number were dynamically introduced, and then a new dynamic K-means clustering algorithm for Genes expressed data was proposed based on multi-dimension fake F-statistic. The experiment results show that the algorithm can adjust cluster number and gain a prime number of clustering, which thus argues that this algorithm can attain better clustering quality.

作者骆嘉伟李仁发张白妮

机构地区湖南大学计算机与通信学院华为技术有限公司

出处《系统仿真学报》 EI CAS CSCD 北大核心 2006年第3期586-589,601,共5页 Journal of System Simulation

基金湖南省自然科学基金(03JJY3095)

关键词聚类分析基因表达数据伪F统计量动态K-均值聚类 clustering analysis genes expressed data fake F-statistics dynamic K-means clustering

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1R Sharan, R Elkon, R Shamir. Cluster Analysis and its Application to Gene Expression Data[C]//In Proceedings of the 38th Ernst Schering workshop on Bioinformatics and Genome Analysis. Japan: Springer Verlag, 2002:83-108.
2Einav U. Class Discovery in Acute Lymphoblastic Leukemia using gene expression analysis[D]. M.Sc Thesis, USA: Kluwer Academic,2003.
3Alon U, Barkai N, Notter man D A, et al. Broad pattems of gene expression revealed by clustering analysis of rumor and normal colon tissues probed by oligonucleotide arrays[C]// Proc. Natl. Acad. Sci USA, 1999,96:6745-6750.
4Eisen M B, Spellman PT, Brown P O. Cluster analysis and display of genome-wide expression patterns [C]//Proc. Natl. Acad. Sci, USA,1998,95:14863-14868.
5Sharan R, Shamir R. CLICK: A Clustering Algorithm with Applications to Gene Expression Analysis[C]//. In Proceedings of the Eighth International Conference on Intelligent Systems for Molecular Biology (ISMB). New York: ACM Press, 2000:307-316.
6Eran Segal, Daphne Koller. Probabilistic Hierarchical Clustering for Biological Data[C]//In Proceedings of the sixth annual international conference on Computational biology. New York: ACM Press, 2002:273-280.
7Kohonen T. Self- OrganizingMaps[M]. New York: Springer- Verlag,1997.
8Brian S Everitt, Graham Dunn. Applied Multivariate Data Analysis[M]. UK: Oxford University Press, 2001.
9Theresa M. Culley, Lisa E. Wallace. Calculating F-Statistics[EB/OL].(2001)[2004]. Http://ib.Berkeley.edu/courses/ib160/h13a.html.
10马振华．现代应用数学手册-概率论与随机过程卷[K]．北京：清华大学出版社，2002．

同被引文献145

1任源鑫,林青,韩婷,李改萍,周旗.陕西省水资源脆弱性评价[J].水土保持研究,2020,27(2):227-232. 被引量：21
2贾晶晶,赵军,王建邦,高超,常若莹.基于SRP模型的石羊河流域生态脆弱性评价[J].干旱区资源与环境,2020,0(1):34-41. 被引量：47
3李敬敏,廖洪富,刘勇谋,姚进.基于灰色关联的设计方案实例模糊预分类方法研究[J].四川大学学报（工程科学版）,2008,40(4):187-190. 被引量：1
4张白妮,骆嘉伟,汤德佑.动态的K-均值聚类算法在图像检索中的应用[J].计算机工程与设计,2004,25(10):1843-1846. 被引量：12
5宫改云,高新波,伍忠东.FCM聚类算法中模糊加权指数m的优选方法[J].模糊系统与数学,2005,19(1):143-148. 被引量：83
6薛忠,谢维信.模糊C均值聚类算法的一种初始化方法[J].系统工程与电子技术,1995,17(11):64-69. 被引量：12
7张文霖.主成分分析在SPSS中的操作应用[J].市场研究,2005(12):31-34. 被引量：317
8佟金,吴娜.臭蜣螂唇基表面轮廓曲线数学模型建立及分析[J].农业机械学报,2006,37(5):113-116. 被引量：10
9于春海,樊治平,孙新波.一种基于多指标语言评价信息的聚类方法[J].东北大学学报（自然科学版）,2006,27(6):698-701. 被引量：2
10白莉红,张文斌.女装号型标准中体型的划分方法[J].纺织学报,2006,27(7):113-116. 被引量：16

引证文献12

1周迎春,骆嘉伟,杨莉.基因序列图形表达及聚类分析应用研究[J].计算机应用,2007,27(9):2330-2333. 被引量：4
2马宝山,朱义胜.用于基因预测的自适应滤波器的仿真研究[J].系统仿真学报,2007,19(24):5620-5623. 被引量：4
3周迎春,骆嘉伟.基于图形表达的基因序列模糊聚类应用研究[J].武汉理工大学学报（信息与管理工程版）,2009,31(1):25-29.
4李光明,殷国富,要小鹏.面向机电设备选型设计方案的精细分类方法[J].中国机械工程,2009(16):1960-1964.
5赵晓燕.基于模糊聚类分析的大学生综合素质评价方法[J].兰州工业高等专科学校学报,2012,19(2):48-51. 被引量：3
6李琦,周鹏.基于改进神经网络的热网短期热负荷预测[J].控制工程,2014,21(4):506-509. 被引量：16
7倪世明,金娟凤,庞程方,邹奉元.基于纵向轮廓曲线的青年女性体型细分研究[J].纺织学报,2014,35(8):87-93. 被引量：7
8夏凤勤,毋戈,谢昊洋,钟跃崎.基于人体纵截面特征曲线的体型分类[J].纺织学报,2017,38(6):86-91. 被引量：20
9张继飞,邓伟,朱昌丽,赵宇鸾.岷江上游生态系统服务与居民福祉的空间关联及其动态特征[J].山地学报,2017,35(3):388-398. 被引量：23
10李剑锋,朱玉晨,刘春雷,李亚松,郝奇琛,李政红.晋江流域生态环境脆弱性评价[J].华东地质,2022,43(1):94-101. 被引量：5

二级引证文献84

1石龙.一种DNA序列的2D图形表示[J].科技信息,2009(1).
2周迎春,骆嘉伟.基于分层的平衡迭代规约聚类分析算法研究[J].科学技术与工程,2008,8(10):2579-2583. 被引量：1
3周迎春,骆嘉伟.一种改进的BIRCH聚类分析算法及其应用研究[J].湛江师范学院学报,2009,30(3):83-87. 被引量：6
4李康顺,王婷,张文生.基于演化算法的FIR数字滤波器设计研究[J].微计算机信息,2010,26(7):43-45.
5郭烁,朱义胜,王庆辉.一种改进的贝叶斯分类器剪接位点预测[J].系统仿真学报,2011,23(7):1429-1432. 被引量：1
6古毅伟,王松,张旭,张茹,刘建毅,仝辉.基因识别及其算法研究[J].数学的实践与认识,2013,43(14):66-76. 被引量：1
7王洪波,荣岩,罗贺,王晓佳.基于流形学习的DNA序列数据挖掘方法研究[J].合肥工业大学学报（自然科学版）,2014,37(8):933-937. 被引量：2
8倪世明,姚怡,叶晓露,辛意云,邹奉元.青年女性矢状面轮廓曲线提取与拟合研究[J].浙江理工大学学报（自然科学版）,2015,33(1):41-45. 被引量：1
9段艳林.基于模糊因素空间理论的大学生综合素质评价[J].聊城大学学报（自然科学版）,2015,28(2):38-42.
10景胜蓝,王飞,雷勇刚.热负荷预测方法研究综述[J].建筑热能通风空调,2015,34(4):31-35. 被引量：25

1刘波,刘伟,余小华.一种改进的主动队列管理算法[J].计算机工程,2008,34(20):118-120. 被引量：1
2王小乐,刘青宝,陆昌辉,侯东风.一种最小生成树聚类算法[J].小型微型计算机系统,2009,30(5):877-882. 被引量：10
3田小平,史鹏敏,吴成茂.基于粒子群的Vague均值聚类分割算法[J].西安邮电大学学报,2015,20(6):61-65. 被引量：3
4龚劬,姚玉敏.基于分水岭和改进的模糊聚类图像分割[J].计算机应用研究,2011,28(12):4773-4775. 被引量：11
5黄宇,付琨,吴一戎.基于Markov随机场K-Means图像分割算法[J].电子学报,2009,37(12):2700-2704. 被引量：21
6李艳灵,沈轶.基于空间邻域信息的FCM图像分割算法[J].华中科技大学学报（自然科学版）,2009,37(6):56-59. 被引量：22
7曹晓霞,赵亮,吴力争.基于多维伪F统计量的基因序列图形动态聚类研究[J].计算机应用与软件,2009,26(9):83-85. 被引量：1
8宋桥,李诚,杜宇人.一种基于Markov随机场的FCM图像分割方法[J].扬州大学学报（自然科学版）,2015,18(1):45-48. 被引量：2
9匡青,鲍梦.改进蚁群算法的动态K-均值聚类分析[J].教育技术导刊,2008(1):154-155. 被引量：7
10郭斐斐.改进蚁群算法的动态K-均值聚类分析[J].软件导刊,2007,6(4):104-105. 被引量：1

系统仿真学报

2006年第3期

浏览历史

内容加载中请稍等...

基于多维伪F统计量的基因表达动态聚类分析方法研究被引量：12

参考文献14

同被引文献145

引证文献12

二级引证文献84

相关作者

相关机构

相关主题

浏览历史

基于多维伪F统计量的基因表达动态聚类分析方法研究 被引量：12

参考文献14

同被引文献145

引证文献12

二级引证文献84

相关作者

相关机构

相关主题

浏览历史

基于多维伪F统计量的基因表达动态聚类分析方法研究被引量：12