基于类别空间的基因选择被引量：9

导出

摘要基因选择通常是在基因空间中进行的.由于基因空间的维数(基因数目)比该空间中的样本数要多得多,这种做法存在严重的维数发难(curse of dimensionality)问题,其结果是在基因空间中所建立数据模型难于获得满意的精度,基于所建立模型的基因选择结果可信度低.如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题.将基因空间变换为它的对偶空间,称为类别空间,从而空间的维数仅为基因空间中样本的类别数,空间中的样本数则为基因空间的维数.显然,在类别空间中不存在任何维数发难现象;提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法.对真实基因数据的基因选择实验,并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标,与其他两种基因选择方法进行了深入的比较,结果表明该方法是十分有效的.

作者张军英 Y.J.Wang J.Khan R.Clarke

机构地区西安电子科技大学雷达信号处理国防重点实验室 Electrical Engineering Institute Cancer Genetics Branch Lombardi Cancer Center

出处《中国科学（E辑）》 CSCD 北大核心 2003年第12期1125-1137,共13页 Science in China(Series E)

基金美国国家健康研究院(NIH)/美国国家癌症研究院(NCI)研究基金(5R21CA83231) 中国国家自然科学基金(批准号:60071026 60371044) 国防科技预研基金(00J1.4.4.DZ0106) 图像信息处理与智能控制国家教育委员会开放实验室基金(TKLJ0005)

关键词类别空间基因选择特征空间特征选择主分量分析维数发难 DNA微阵列数据基因诊断基因表达

分类号 Q75 [生物学—分子生物学]

引文网络
相关文献

参考文献22

1[1]Khan J, Wei J S, Ringner M, et al. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature Medicine, 2001, 7(6): 673～679
2[2]Anil K, Robert P R, Mar Jianchang. Statistical pattern recognition: A review. IEEE Trans Pattern Analysis and Machine Intelligence, 2000, 22(1): 4～37
3[3]Herrero J, Valencia A, Dopazo J. A hierarchical unsupervised growing neural network for clustering gene expression patterns. bioinformatics, 2001, 17(2): 126～136
4[4]Loog M, duin R P W. Multiclass linear dimension reduction by weighted pairwise Fisher criteria. IEEE Trans Pattern Analysis and Machine Intelligence, 2001, 23(7): 762～766
5[5]Mjolsness E, DeCoste D. Machine learning for science: State of the art and future prospects. Science, 2001, 293(14): 2051～2055
6[6]Ramaswarmy S, Tamayo P, Rifkin R, et al. Multiclass cancer diagnosis using tumor gene expression signatures. PNAS, 2001, 26: 15149～15154
7[7]Xiong Momiao, Fang Xiangzhong, Zhao Jinying. Biomarker identification by feature wrappers. Genome Research (see www.genome.org), 2001, 11: 178～188
8[8]Dudoit S, Fridlyand J, Speed T P. Comparison of discrimination methods for the classification of tumors using gene expression data, Technical report #576, University of California, Berkeley, June 2000
9[9]Guyon I, Weston J, Barnhill S, et al. Gene selection for cancer classification using support vector machines. Machine Learning, 2002, 46(3): 389～422
10[10]Kohavi R, John G H. Wrappers for feature subset selection. Artificial Intelligence, 1997, 97(1/2): 273～324

二级参考文献6

1陈彬,洪家荣,王亚东.最优特征子集选择问题[J].计算机学报,1997,20(2):133-138. 被引量：96
2Agrawal R, Srikant R. Mining sequential patterns[A]. Proc 11th Int'l Conf Data Eng[C]. 1995. 3-14.
3John A Rushing, et al. Using association rules as texture features[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2001, 23(8):845-858.
4Houtsma M, Swami A. Set-oriented mining for association rules in relational databases[A]. Proc 11th Int'l Conf. Data Eng[C]. 1995. 25-33.
5章毓晋.图像处理和分析[M].北京：清华大学出版社,1999..
6洪家荣.示例学习的扩张矩阵理论[J].计算机学报,1991,14(6):401-410. 被引量：31

共引文献24

1顾军华,周艳聪,宋洁.基于遗传算法的最小约简算法研究[J].河北科技大学学报,2001,22(3):94-97. 被引量：1
2王春迎,郝士琦,李洪淘,张军.信号特征选择的一种优化算法[J].航空电子技术,2005,36(1):25-28. 被引量：1
3王春迎,郝士琦,李洪涛.特征选择的优化算法研究[J].计算机仿真,2005,22(9):99-102. 被引量：1
4李国和.基于类扩张矩阵的信息系统特征选取[J].计算机工程,2006,32(17):52-54. 被引量：2
5李国和.基于标识特征的信息系统特征选取[J].计算机科学,2008,35(4):157-159.
6宋淑彩,庞慧,丁学钧.GA-SVM算法在文本分类中的应用研究[J].计算机仿真,2011,28(1):222-225. 被引量：13
7赖娟.基于数据挖掘的文本自动分类仿真研究[J].计算机仿真,2011,28(12):195-198. 被引量：2
8李国和,岳翔,李雪,吴卫江,李洪奇.一种面向连续型属性的特征选取方法[J].山东大学学报（工学版）,2011,41(6):1-6.
9任剑锋,梁雪,李淑红.基于非线性流形学习和支持向量机的文本分类算法[J].计算机科学,2012,39(1):261-263. 被引量：10
10周戈.一种基于反向文本频率互信息的文本挖掘算法研究[J].计算机应用研究,2012,29(2):487-489. 被引量：9

同被引文献189

1邓赵红,王士同,胡德文.适于癌基因表达数据集的新特征提取标准NFEC及其分类新算法研究[J].生物信息学,2004,2(2):13-20. 被引量：3
2李霞,张田文,郭政.一种基于递归分类树的集成特征基因选择方法[J].计算机学报,2004,27(5):675-682. 被引量：26
3李云,叶春晓,李季,刘嘉敏,吴中福.基于特征关联性的特征选择算法研究[J].微型机与应用,2004,23(6):58-60. 被引量：6
4王明怡,吴平,王德林.基于相关性分析的基因选择算法[J].浙江大学学报（工学版）,2004,38(10):1289-1292. 被引量：4
5张丽新,王家廞,赵雁南,杨泽红.基于Relief的组合式特征选择[J].复旦学报（自然科学版）,2004,43(5):893-898. 被引量：44
6封举富,时建新.基因选择的快速Fisher优化模型[J].北京大学学报（自然科学版）,2005,41(1):122-128. 被引量：2
7徐连彬,王亚东,李霞,杨得印.基于基因表达谱的疾病亚型特征基因挖掘方法[J].生物信息学,2005,3(2):69-72. 被引量：1
8李颖新,阮晓钢.基于支持向量机的肿瘤分类特征基因选取[J].计算机研究与发展,2005,42(10):1796-1801. 被引量：51
9刘全金,李颖新,朱云华,阮晓钢.基于BP神经网络的肿瘤特征基因选取[J].计算机工程与应用,2005,41(34):184-186. 被引量：6
10李颖新,李建更,阮晓钢.肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J].计算机学报,2006,29(2):324-330. 被引量：45

引证文献9

1姬翔,王安文.一种基于SVM和相关性的基因选择方法[J].计算机应用与软件,2007,24(6):116-118. 被引量：1
2周昉,何洁月.生物信息学中基因芯片的特征选择技术综述[J].计算机科学,2007,34(12):143-150. 被引量：20
3张丽娟,李舟军.微阵列数据癌症分类问题中的基因选择[J].计算机研究与发展,2009,46(5):794-802. 被引量：20
4方文道,章坚民,刘登涛,杨阳.基于自适应遗传算法的特征基因选择[J].科技通报,2011,27(2):241-245. 被引量：3
5耿耀君,张军英.一种基于监督降维和形状分析的基因选择方法[J].西安电子科技大学学报,2011,38(3):121-127. 被引量：1
6耿耀君,张军英.一种基于投影稀疏表示的基因选择方法[J].哈尔滨工程大学学报,2011,32(8):1024-1028. 被引量：2
7谢娟英,高红超.基于统计相关性与K-means的区分基因子集选择算法[J].软件学报,2014,25(9):2050-2075. 被引量：56
8许明,郑鹭斌,谢彦麒,陈玉明.基于邻域熵与蚁群优化的基因选择算法[J].福州大学学报（自然科学版）,2017,45(6):815-821. 被引量：1
9张军英,刘利平.基于部分独立分量分析的盲源分离[J].西安电子科技大学学报,2004,31(3):334-337. 被引量：3

二级引证文献100

1周文佳,吕金超,高翔.基于统计检验的基因表达数据特征选取与分类模型[J].数学建模及其应用,2019,8(4):48-53. 被引量：1
2王海鹏,杨昆.集成数据选择特征基因[J].杭州电子科技大学学报（自然科学版）,2010,30(6):17-20. 被引量：2
3孙永军,易克初.利用核方法的直扩系统多个窄带干扰抑制[J].西安电子科技大学学报,2007,34(4):554-557. 被引量：2
4王法松,李宏伟,李睿.非参数GKNN估计的高效独立成分分析算法[J].西安电子科技大学学报,2008,35(4):764-768. 被引量：1
5李小波.肿瘤基因表达谱分类技术研究[J].计算机时代,2008(6):11-14.
6杨昆,徐静,张彦斌.基因选择的0-1规划模型和算法[J].计算机工程与应用,2010,46(20):184-187. 被引量：1
7肖宇,朱敏,黄俊.基于LS-SVM的供应链合作伙伴选择[J].计算机与数字工程,2010,38(9):156-158. 被引量：1
8于化龙,顾国昌,赵靖,刘海波,沈晶.基于DNA微阵列数据的癌症分类问题研究进展[J].计算机科学,2010,37(10):16-22. 被引量：20
9殷海青,刘红卫.一种基于L_1稀疏正则化和非负矩阵分解的盲源信号分离新算法[J].西安电子科技大学学报,2010,37(5):835-841. 被引量：7
10王振华,范太华,张晖.基于本体的白血病特征基因选取研究[J].电脑知识与技术,2010(12):9785-9787.

1ZHANGJunying,YueJosephWANG,JavedKHAN,RobertCLARKE.Gene selection in class space for molecular classification of cancer[J].Science in China(Series F),2004,47(3):301-314. 被引量：3
2科学家研究发现多数疾病与遗传有关[J].中成药,2005,27(6):642-642.
3同性恋是基因选择的结果[J].大家健康,2009(2):45-45.
4健康·天下[J].医学美学美容,2006(9):78-78.
5马宁,张正国.一种基于Gene Ontology注释信息的基因选择算法[J].中国生物医学工程学报,2009,28(5):696-700. 被引量：3
6于颖彦.生物信息学(6):生物信息学与医学研究[J].外科理论与实践,2007,12(2). 被引量：1
7马尽文,邓明华.第五讲生物医学信息处理——DNA微阵列数据在医学中的应用[J].物理,2005,34(5):371-380.
8陈惟昌,陈志义.大脑神经网络的高维信息编码空间[J].科学,1994,46(4):34-36.
9曾斯祥.用“大数据”防治疟疾[J].中文自修,2016,0(13):78-79. 被引量：1
10骆宏,陆惠玲,吕德坚.运用分子生物学方法鉴定生物检材种属的研究进展[J].中国法医学杂志,2007,22(2):108-110. 被引量：1

中国科学（E辑）

2003年第12期

浏览历史

内容加载中请稍等...

基于类别空间的基因选择被引量：9

参考文献22

二级参考文献6

共引文献24

同被引文献189

引证文献9

二级引证文献100

相关作者

相关机构

相关主题

浏览历史

基于类别空间的基因选择 被引量：9

参考文献22

二级参考文献6

共引文献24

同被引文献189

引证文献9

二级引证文献100

相关作者

相关机构

相关主题

浏览历史

基于类别空间的基因选择被引量：9