期刊文献+

多种字符串相似度算法的比较研究 被引量:38

Comparation of String Similarity Algorithm
在线阅读 下载PDF
导出
摘要 对计算字符串相似度的编辑距离算法、最长公共子串算法、贪心字符串匹配算法、RKR-GST等多种算法,根据匹配过程是否有序,对这些算法进行了分类。然后对每种算法的实现原理进行了描述,并给出每个算法的运行步骤,结合一个实际的例子列出了算法运行的结果,最后给出每种算法计算相似度的计算公式和算法时间复杂度及应用领域。由于字符串相似度具有广泛的应用领域,对其中经典的几种算法进行总结对比是一件十分有意义的研究工作。 For Levenshtein Distance,Longest Common Subsequences,Greedy String Tiling,RKR-GST and other algorithms,these algorithms were classified according to whether the matching process is orderly.Then the realization of the principles of each algorithm was described,and given the run of each algorithm step,combined with a practical example shows the results of the algorithm,the formula of similarity and algorithm time complexity and applications of each algorithm were given.As the string similarity with a wide range of applications,which is a very meaningful work to summarize the several classic algorithms.
作者 牛永洁 张成
出处 《计算机与数字工程》 2012年第3期14-17,共4页 Computer & Digital Engineering
基金 陕西省教育厅自然科学项目:SOC关键技术研究及应用(编号:11JK1054)资助
关键词 字符串相似度 编辑距离 最长公共子串 贪心字符串匹配 RKR-GST string similarity levenshtein distance longest common subsequences greedy string tiling RKR-GST
  • 相关文献

参考文献11

二级参考文献52

  • 1车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量:66
  • 2朱映辉,江玉珍.计算机自动评卷策略分析与研究[J].电脑知识与技术,2005(12):30-32. 被引量:6
  • 3程金宏,刘东升.程序代码相似度自动度量技术研究综述[J].内蒙古师范大学学报(自然科学汉文版),2006,35(4):457-461. 被引量:13
  • 4孔明.国外计算机自动评分研究现状述评[J].中国考试,2007(5):14-18. 被引量:7
  • 5BRIN S, PAGE L. The anatomy of a large-scale hypertextual web search engine[J]. Computer Networks and ISDN Systems, 1998, 30 (1/7): 107-117.
  • 6OGILVIE P, CALLAN J. Combining structural information and the use of priors in mixed named-page and homepage finding[EB/OL].[2006-10-11]. http://www. scils, rutgers, edu/-muresan/IR/TREC/Notebooks/t12-notebook/papers/cmu-dir, web. pdf.
  • 7BAEZA-YATES R A, RIBEIRO-NETO B A. Modern information retrieval [M]. Reading, MA, USA: Addison-Wesley Publishing Company, 1999.
  • 8ROBERTSON S E, WALKER S, HANCOCKBEAULIEU M. Experimentation as a way of life: OKAPI at TREC[J]. Information Processing & Management, 2000,36 ( 1 ): 95-108.
  • 9BUTTCHER S, CLARKE C L A, LUSHMAN B. Term proximity scoring for ad-hoc retrieval on very large text collections [C]// Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA: ACM, 2006: 621-622.
  • 10MITTAL V, BALUJA S, SAHAMI M. The happy searcher:challenges in web information retrieval[EB/ OL]. [2006-12-10]. http://www. cs. cmu. edu/-har/PRICAI-2004, pdf.

共引文献110

同被引文献326

引证文献38

二级引证文献176

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部