期刊文献+

基于类别空间的基因选择 被引量:9

原文传递
导出
摘要 基因选择通常是在基因空间中进行的.由于基因空间的维数(基因数目)比该空间中的样本数要多得多,这种做法存在严重的维数发难(curse of dimensionality)问题,其结果是在基因空间中所建立数据模型难于获得满意的精度,基于所建立模型的基因选择结果可信度低.如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题.将基因空间变换为它的对偶空间,称为类别空间,从而空间的维数仅为基因空间中样本的类别数,空间中的样本数则为基因空间的维数.显然,在类别空间中不存在任何维数发难现象;提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法.对真实基因数据的基因选择实验,并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标,与其他两种基因选择方法进行了深入的比较,结果表明该方法是十分有效的.
出处 《中国科学(E辑)》 CSCD 北大核心 2003年第12期1125-1137,共13页 Science in China(Series E)
基金 美国国家健康研究院(NIH)/美国国家癌症研究院(NCI)研究基金(5R21CA83231) 中国国家自然科学基金(批准号:60071026 60371044) 国防科技预研基金(00J1.4.4.DZ0106) 图像信息处理与智能控制国家教育委员会开放实验室基金(TKLJ0005)
  • 相关文献

参考文献22

  • 1[1]Khan J, Wei J S, Ringner M, et al. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature Medicine, 2001, 7(6): 673~679
  • 2[2]Anil K, Robert P R, Mar Jianchang. Statistical pattern recognition: A review. IEEE Trans Pattern Analysis and Machine Intelligence, 2000, 22(1): 4~37
  • 3[3]Herrero J, Valencia A, Dopazo J. A hierarchical unsupervised growing neural network for clustering gene expression patterns. bioinformatics, 2001, 17(2): 126~136
  • 4[4]Loog M, duin R P W. Multiclass linear dimension reduction by weighted pairwise Fisher criteria. IEEE Trans Pattern Analysis and Machine Intelligence, 2001, 23(7): 762~766
  • 5[5]Mjolsness E, DeCoste D. Machine learning for science: State of the art and future prospects. Science, 2001, 293(14): 2051~2055
  • 6[6]Ramaswarmy S, Tamayo P, Rifkin R, et al. Multiclass cancer diagnosis using tumor gene expression signatures. PNAS, 2001, 26: 15149~15154
  • 7[7]Xiong Momiao, Fang Xiangzhong, Zhao Jinying. Biomarker identification by feature wrappers. Genome Research (see www.genome.org), 2001, 11: 178~188
  • 8[8]Dudoit S, Fridlyand J, Speed T P. Comparison of discrimination methods for the classification of tumors using gene expression data, Technical report #576, University of California, Berkeley, June 2000
  • 9[9]Guyon I, Weston J, Barnhill S, et al. Gene selection for cancer classification using support vector machines. Machine Learning, 2002, 46(3): 389~422
  • 10[10]Kohavi R, John G H. Wrappers for feature subset selection. Artificial Intelligence, 1997, 97(1/2): 273~324

二级参考文献6

  • 1陈彬,洪家荣,王亚东.最优特征子集选择问题[J].计算机学报,1997,20(2):133-138. 被引量:96
  • 2Agrawal R, Srikant R. Mining sequential patterns[A]. Proc 11th Int'l Conf Data Eng[C]. 1995. 3-14.
  • 3John A Rushing, et al. Using association rules as texture features[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2001, 23(8):845-858.
  • 4Houtsma M, Swami A. Set-oriented mining for association rules in relational databases[A]. Proc 11th Int'l Conf. Data Eng[C]. 1995. 25-33.
  • 5章毓晋.图像处理和分析[M].北京:清华大学出版社,1999..
  • 6洪家荣.示例学习的扩张矩阵理论[J].计算机学报,1991,14(6):401-410. 被引量:31

共引文献24

同被引文献189

引证文献9

二级引证文献100

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部