期刊文献+

DNA测序问题——2003年第3期题解

在线阅读 下载PDF
导出
摘要 问题分析这是一道典型的分类问题,我们知道该问题的关键是要从已知的分好类的20个字母序列中提取用于分类的特征。知道了这些特征,我们就可以比较容易的对那些未表明类型的序列进行分类。分类标准:(1)所取特征必须可以标志A组和B组,也就是说,我们利用这些特征应该可以很好的区分已经表示分类的20序列。这是一个比较显然的理由。(2)所取特征必须是有一定的实际意义的。这一点是绝不能被忽视的。比如,不考虑模型的实际意义,我们可以以序列的开头字母为分类标准:已知在B类中的十个序列都是以gt开始的,而在A类中十个没有以gt开始的,甚至以g开始的都没有。显然这个条件满足第一个条件的。如果仅因此就认为这种特征是主要的,并简单的利用这个特征将所有待分类的序列分成两类,显然是不合理的。基于上述分类标准,我们利用DNA序列的局部性和全局性的特征,从频率角度和周期性角度出发来综合分析这道分类问题。
作者 马安光
出处 《程序员》 2003年第5期105-106,共2页 Programmer
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部