摘要
元搜索引擎集合了多个成员搜索引擎的结果,将结果进行一定的处理后再将处理后的结果返回给用户。其中对结果的重新排序直接影响到元搜索引擎的性能。基于通信领域上的信息量与信息熵提出一种计算结果相关度的算法——信息关联度IRD算法,再将算法进行特定的修正,并提出一种合并算法CombMul,将以上算法应用到元搜索引擎中,最终用MRR查准率来评价此方法。得到的MRR查准率数据表明,与广泛应用的Borda排序算法相比,IRD算法结果更为理想。
The meta search engine collects results from many search engines, using a certain way to treat the results and then returning back to the users. Reranking the results will directly affect the performance of meta search engine. This paper was based on information quantity and entropy which are used in communication field then presented a calculation algorithm information related degree(1RD), after a particular amendment to the IRE) algorithm, this paper also proposed a merging algorithm combMul. The above algorithms were applied to the meta search engine, and MRR precision was used to evaluate the algorithm. The MRR precision data show that IRD algorithm is even better compared with a widely used sorting algorithm Borda.
出处
《计算机科学》
CSCD
北大核心
2012年第3期153-156,191,共5页
Computer Science
基金
国家自然科学基金项目(60673186和60971088)
江苏省高校"青蓝工程"中青年学术带头人培养对象项目
教育部新世纪优秀人才支持计划(NCET-10-0327)资助
关键词
元搜索引擎
排序算法
信息关联度
IRD
信息量
信息熵
CombMul
Meta search mngine, Ranking algorithm, Information related degree, IRE), Information quantity, Entropy, CombMul