期刊文献+

两种重复提取算法的研究比较 被引量:1

原文传递
导出
摘要 在利用计算机处理文本信息时,为了能发现大文本信息中的重复词句,本文介绍两种用来发现重复词句的算法——基于后缀树的方法和基于倒排索引的方法。第一种ST算法使用树型数据结构,每个节点表示一个字并且根节点为空。第二种算法应用倒排索引,以及哈希表实现方法(HT)。对同一样本运行仿真后,在时间和空间复杂度上对实验结果进行比较。得出结论,尽管ST算法在考虑到时间成本时要更优,但在空间复杂度方面倒排索引方法更胜一筹。
出处 《网络安全技术与应用》 2009年第1期64-66,共3页 Network Security Technology & Application
  • 相关文献

参考文献2

  • 1Grolmus P.,Hynek J.,Jezek K.User Profile Identification Based On Text Mining[].ProcOfth IntConfISIM‘.2003
  • 2Debar H,et a1.Fixed vs.variable—length patterns for detecting suspicious process[].Procof theESORICS Conference.1998

同被引文献5

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部