摘要
信息基因选择在肿瘤识别问题中起着关键作用。本文提出了一种新的组合式的肿瘤信息基因选择方法,首先从单个基因的样本相关性角度出发,采用BW-ratio过滤指标对基因子集进行初选;然后采用二进制量子粒子群算法进一步对信息基因精选,支持向量机(SVM)作为分类器来测试和评估所选出的肿瘤信息基因的分类能力。在二进制量子粒子群算法中,我们给出了一种新的粒子更新的公式。实验是在两个公开的基因表达谱数据集急性白血病(Leukemia)和结肠癌(Colon Tumor)上完成,分别只需5和7个信息基因就能获得了100%和96.77%的10折交叉验证识别准确率。实验结果表明了所提出的信息基因选择方法对于肿瘤的识别问题研究的有效性和可行性。
Informatics gene selection plays an important role in tumor recognition.In this paper,a novel gene selection method is proposed,which firstly uses a BW ratio filter method to remove the genes that are irrelevant to tumor recognition and then adopts a binary Quantum behaved Particle Swarm Optimization(BQPSO) algorithm to remove redundant genes.The support vector machine(SVM) is used as an evaluator to estimate performance of the selected feature gene subsets for tumor diagnosing.Experiment results show that 100% and 96.77% of 10-fold cross-validation accuracy has been achieved by only five and seven genes for leukemia,colon tumor datasets.The results show the proposed algorithm is effective and feasible.
出处
《微计算机信息》
2011年第1期224-226,共3页
Control & Automation
基金
基金申请人:骆嘉伟
项目名称:新型表达模式下的功能基因分析算法研究
基金颁发部门:国家自然科学基金委(60873184)
基金申请人:骆嘉伟
项目名称:基于聚类的基因功能预测方法
基金颁发部门湖南省自然科学基金委(07JJ5086)