期刊文献+

基于特征码的网页去重 被引量:11

Duplicated Webpages Deletion Based on Feature Code
在线阅读 下载PDF
导出
摘要 网页去重处理是提高检索质量的有效途径,本文给出了一个基于特征码的网页去重算法,介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检索中有较好的应用前景。 Duplicated webpages deletion can improve quality of information retrieval. A duplicated webpages deletion algorithm based on feature code is given , the main steps of algorithm are introduced, the algorithm is realized on binary sort tree. The algorithm's precision is high, has better application in information retrieval.
出处 《微计算机信息》 北大核心 2006年第03X期113-115,共3页 Control & Automation
基金 广西区科技攻关项目(桂科攻0428002-1)
关键词 网页去重 网页特征码 二叉排序树 Duplicated webpages deletion feature code of webpages binary sort tree
  • 相关文献

参考文献3

  • 1谢立,王永强,于德敏,许增朴.利用图像的灰度特征实现半透明产品的识别[J].微计算机信息,2005,21(07X):44-45. 被引量:10
  • 2Finding near-replicas of documents on the web. Narayanan Shivakumar, et al. WebDB 1998
  • 3Finding replicated web collections. Junghoo Cho, N. Shivakumar et al. In Proceedings of 2000 ACM International Conference on Management of Data (SIGMOD), May 2000.

二级参考文献5

共引文献9

同被引文献106

引证文献11

二级引证文献33

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部