摘要
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法。传统方法主要是基于距离的度量和基于信息量的度量。文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法。该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值。实验结果表明该算法具有较高的相关系数。
基金
国家"八六三"计划项目(2002AA231011)
上海市科委重大项目(02DJ14013)资助