期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
Multi-Pattern Matching Algorithm with Wildcards Based on Bit-Parallelism
1
作者 Ahmed A. F. Saif HU Liang CHU Jianfeng 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2017年第2期178-184,共7页
Multi-pattern matching with wildcards is a problem of finding the occurrence of all patterns in a pattern set {p^1,… ,p^k} in a given text t. If the percentage of wildcards in pattern set is not high, this problem ca... Multi-pattern matching with wildcards is a problem of finding the occurrence of all patterns in a pattern set {p^1,… ,p^k} in a given text t. If the percentage of wildcards in pattern set is not high, this problem can be solved using finite automata. We introduce a multi-pattern matching algorithm with a fixed number of wildcards to overcome the high percentage of the occurrence of wildcards in patterns. In our proposed method, patterns are matched as bit patterns using a sliding window approach. The window is a bit window that slides along the given text, matching against stored bit patterns. Matching process is executed using bit wise operations. The experimental results demonstrate that the percentage of wildcard occurrence does not affect the proposed algorithm's performance and the proposed algorithm is more efficient than the algorithms based on the fast Fourier transform. The proposed algorithm is simple to implement and runs efficiently in O(n + d(n/σ )(m/w)) time, where n is text length, d is symbol distribution over k patterns, m is pattern length, and σ is alphabet size. 展开更多
关键词 multi-pattern string matching WILDCARD bitparallelism
原文传递
Parallel Quick Search Algorithm for the Exact String Matching Problem Using OpenMP
2
作者 Sinan Sameer Mahmood Al-Dabbagh Nawaf Hazim Barnouti +1 位作者 Mustafa Abdul Sahib Naser Zaid G. Ali 《Journal of Computer and Communications》 2016年第13期1-11,共11页
String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that... String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that is created and kept by modern computational devices influences researchers to obtain even more powerful methods for coping with this problem. In this research, the Quick Search string matching algorithm are adopted to be implemented under the multi-core environment using OpenMP directive which can be employed to reduce the overall execution time of the program. English text, Proteins and DNA data types are utilized to examine the effect of parallelization and implementation of Quick Search string matching algorithm on multi-core based environment. Experimental outcomes reveal that the overall performance of the mentioned string matching algorithm has been improved, and the improvement in the execution time which has been obtained is considerable enough to recommend the multi-core environment as the suitable platform for parallelizing the Quick Search string matching algorithm. 展开更多
关键词 string matching Pattern matching string Searching algorithmS Quick Search algorithm Exact string matching algorithm ? Parallelization OPENMP
在线阅读 下载PDF
The Factors Analysis and Algorithm Implementation of Single-pattern Matching
3
作者 刘功申 朱圣军 《Journal of Shanghai Jiaotong university(Science)》 EI 2009年第3期331-337,共7页
By studying the algorithms of single pattern matching, five factors that have effect on time complexity of the algorithm are analyzed. The five factors are: sorting the characters of pattern string in an increasing o... By studying the algorithms of single pattern matching, five factors that have effect on time complexity of the algorithm are analyzed. The five factors are: sorting the characters of pattern string in an increasing order of using frequency, utilizing already-matched pattern suffix information, utilizing already-matched pattern prefix information, utilizing the position factor which is absorbed from quick search algorithm, and utilizing the continue-skip idea which is originally proposed by this paper. Combining all the five factors, a new single pattern matching algorithm is implemented. It's proven by the experiment that the efficiency of new algorithm is the best of all algorithms. 展开更多
关键词 single pattern matching string search algorithm analysis
原文传递
A Fast Pattern Matching Algorithm Using Changing Consecutive Characters
4
作者 Amjad Hudaib Dima Suleiman Arafat Awajan 《Journal of Software Engineering and Applications》 2016年第8期399-411,共13页
Pattern matching is a very important algorithm used in many applications such as search engine and DNA analysis. They are aiming to find a pattern in a text. This paper proposes a Pattern Matching Algorithm Using Chan... Pattern matching is a very important algorithm used in many applications such as search engine and DNA analysis. They are aiming to find a pattern in a text. This paper proposes a Pattern Matching Algorithm Using Changing Consecutive Characters (PMCCC) to make the searching pro- cess of the algorithm faster. PMCCC enhances the shift process that determines how the pattern moves in case of the occurrence of the mismatch between the pattern and the text. It enhances the Berry Ravindran (BR) shift function by using m consecutive characters where m is the pattern length. The formal basis and the algorithms are presented. The experimental results show that PMCCC made enhancements in searching process by reducing the number of comparisons and the number of attempts. Comparing the results of PMCCC with other related algorithms has shown significant enhancements in average number of comparisons and average number of attempts. 展开更多
关键词 PATTERN Pattern matching algorithms string matching Berry Ravindran EBR RS-A Fast Pattern matching algorithms
在线阅读 下载PDF
CUSMART:effective parallelization of stringmatching algorithms using GPGPU accelerators
5
作者 Adnan OZSOY Mengu NAZLI +1 位作者 Onur CANKUR Cagri SAHIN 《Frontiers of Information Technology & Electronic Engineering》 2025年第6期877-895,共19页
This study presents a parallel version of the string matching algorithms research tool(SMART)library,implemented on NVIDIA’s compute unified device architecture(CUDA)platform,and uses general-purpose computing on gra... This study presents a parallel version of the string matching algorithms research tool(SMART)library,implemented on NVIDIA’s compute unified device architecture(CUDA)platform,and uses general-purpose computing on graphics processing unit(GPGPU)programming concepts to enhance performance and gain insight into the parallel versions of these algorithms.We have developed the CUDA-enhanced SMART(CUSMART)library,which incorporates parallelized iterations of 64 string matching algorithms,leveraging the CUDA application programming interface.The performance of these algorithms has been assessed across various scenarios to ensure a comprehensive and impartial comparison,allowing for the identification of their strengths and weaknesses in specific application contexts.We have explored and established optimization techniques to gauge their influence on the performance of these algorithms.The results of this study highlight the potential of GPGPU computing in string matching applications through the scalability of algorithms,suggesting significant performance improvements.Furthermore,we have identified the best and worst performing algorithms in various scenarios. 展开更多
关键词 string matching Parallel programming Graphics processing unit(GPU)programming General-purpose computing on GPU(GPGPU) NVIDIA Compute unified device architecture(CUDA) string matching algorithms research tool(SMART)
原文传递
Memory Efficient String Matching Algorithm for Network Intrusion Management System 被引量:9
6
作者 余建明 薛一波 李军 《Tsinghua Science and Technology》 SCIE EI CAS 2007年第5期585-593,共9页
As the core algorithm and the most time consuming part of almost every modern network intrusion management system (NIMS), string matching is essential for the inspection of network flows at the line speed. This pape... As the core algorithm and the most time consuming part of almost every modern network intrusion management system (NIMS), string matching is essential for the inspection of network flows at the line speed. This paper presents a memory and time efficient string matching algorithm specifically designed for NIMS on commodity processors. Modifications of the Aho-Corasick (AC) algorithm based on the distribution characteristics of NIMS patterns drastically reduce the memory usage without sacrificing speed in software implementations. In tests on the Snort pattern set and traces that represent typical NIMS workloads, the Snort performance was enhanced 1.48%-20% compared to other well-known alternatives with an automaton size reduction of 4.86-6.11 compared to the standard AC implementation. The results show that special characteristics of the NIMS can be used into a very effective method to optimize the algorithm design. 展开更多
关键词 string matching network intrusion management system (NIMS) Aho-Corasick (AC) algorithm
原文传递
一种计算存储设备中的字符串并行匹配算法
7
作者 张东阳 刘东石 +2 位作者 苏攀 马玉梅 王其乐 《计算机技术与发展》 2025年第8期25-35,共11页
传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最... 传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最差情况下的性能瓶颈等问题,提出了基于计算存储设备(Computational Storage Device,CSD)的解决方法。该方法通过在存储器内部部署嵌入式处理引擎,将计算移动到存储端,大幅减少了数据在处理单元和存储单元之间的传输,从而显著提升了整体计算效率。将现场可编程门阵列(Field Programmable Gate Array,FPGA)作为CSD嵌入式处理引擎,利用其并行处理能力,设计了一种高效的精确字符串并行匹配算法。在FPGA读取数据的同时,完成字符串匹配工作,消除了字符串匹配过程中的额外时间开销。实验结果表明,基于CSD的解决方法展现出了显著的性能优势,为大数据环境下的字符串匹配问题提供了一种新的解决方案。 展开更多
关键词 字符串匹配 计算存储设备 现场可编程门阵列 并行 算法
在线阅读 下载PDF
基于局部标签树匹配的网页相似度去重算法
8
作者 邱紫韵 《西安文理学院学报(自然科学版)》 2025年第2期16-21,共6页
当搜索引擎进行网页相似度去重时,可能会使相似的内容被合并为一个链接,导致搜索结果的精确率降低,用户难以找到真正希望找到的页面.为优化搜索引擎、提高用户体验,提出基于局部标签树匹配的网页相似度去重算法.利用爬虫技术抓取网络中... 当搜索引擎进行网页相似度去重时,可能会使相似的内容被合并为一个链接,导致搜索结果的精确率降低,用户难以找到真正希望找到的页面.为优化搜索引擎、提高用户体验,提出基于局部标签树匹配的网页相似度去重算法.利用爬虫技术抓取网络中的网页内容,将这些网页的HTML结构解析成标签树的形式,每个节点代表一个HTML标签.针对每个标签节点,采用基于词频-逆文本频率算法筛选关键词,并利用关键词提取关键句,从而获取网页局部标签树的特征串.采用LCS算法遍历整个局部标签树,计算不同标签节点之间的相似度,剔除相似度较高的网页,即可完成网页相似度去重.经实验验证:该算法可以高效率地完成特征串提取,在去重时F值与召回率均保持在95%以上,可以有效地实现网页相似度去重工作. 展开更多
关键词 局部标签树匹配 网页相似度去重 LCS算法 特征串
在线阅读 下载PDF
一种改进的KMP高效模式匹配算法 被引量:27
9
作者 鲁宏伟 魏凯 孔华锋 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第10期41-43,共3页
针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳... 针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳跃k个值,且使模式串的指针置于起始位置,开始新一轮的匹配,加快了主串的匹配速度.理论分析和试验证明,该算法需要的比较次数比KMP算法减少将近一半. 展开更多
关键词 模式匹配 算法 模式串 主串 时间复杂度
在线阅读 下载PDF
一种时间复杂度最优的精确串匹配算法 被引量:25
10
作者 贺龙涛 方滨兴 余翔湛 《软件学报》 EI CSCD 北大核心 2005年第5期676-683,共8页
现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地... 现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(logσm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用. 展开更多
关键词 后缀自动机 有限状态自动机 LDM算法 串匹配 复杂度分析
在线阅读 下载PDF
一种快速的字符串匹配算法 被引量:25
11
作者 钱屹 侯义斌 《小型微型计算机系统》 CSCD 北大核心 2004年第3期410-413,共4页
字符串匹配技术在许多领域里广泛应用 ,本文在分析了 BF、BM算法以及一些重要的改进算法的基础上 ,提出了一种新的改进算法—— BMH2 C,该算法利用两个字符计算右移量并保存在二维数组里 ,使右移量增大 ,比较次数减少 ,有效地提高了匹... 字符串匹配技术在许多领域里广泛应用 ,本文在分析了 BF、BM算法以及一些重要的改进算法的基础上 ,提出了一种新的改进算法—— BMH2 C,该算法利用两个字符计算右移量并保存在二维数组里 ,使右移量增大 ,比较次数减少 ,有效地提高了匹配速度 . 展开更多
关键词 模式匹配 字符串检索 字符串匹配算法 BMH2C算法 BF算法 BM算法
在线阅读 下载PDF
改进的多模式字符串匹配算法 被引量:11
12
作者 蔡晓妍 戴冠中 杨黎斌 《计算机应用》 CSCD 北大核心 2007年第6期1415-1417,共3页
在经典的AC多模式字符串匹配算法的基础上,结合BMH算法的优点,提出了一种快速的多模式字符串匹配算法。一般情况下,该算法不需要匹配目标文本串中的每个字符,而是在实际比较之前跳过尽可能多的字符,以减少字符比较的操作,实现快速匹配... 在经典的AC多模式字符串匹配算法的基础上,结合BMH算法的优点,提出了一种快速的多模式字符串匹配算法。一般情况下,该算法不需要匹配目标文本串中的每个字符,而是在实际比较之前跳过尽可能多的字符,以减少字符比较的操作,实现快速匹配。在模式串较长和较短的情况下,算法都有很好的性能。实验表明,在模式串较短时,本算法所需的时间仅为AC算法的50%~30%;在模式串较长时,所需时间为AC算法的26.7%~15.2%。 展开更多
关键词 字符串匹配 AC算法 BMH算法 多模式匹配 算法复杂度
在线阅读 下载PDF
一种基于熵的文本相似性计算方法 被引量:13
13
作者 李圣文 凌微 +1 位作者 龚君芳 周长征 《计算机应用研究》 CSCD 北大核心 2016年第3期665-668,共4页
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法... 文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。 展开更多
关键词 文本相似性 字符串匹配 编辑距离算法 最长公共子序列
在线阅读 下载PDF
对BM串匹配算法的一个改进 被引量:9
14
作者 贺龙涛 方滨兴 胡铭曾 《计算机应用》 CSCD 北大核心 2003年第3期6-8,12,共4页
在对著名的Boyer -Moore串匹配算法进行分析后 ,对BM算法中的尝试位置移动处理部分进行改进 ,提出了IBM算法。该算法将好后缀移动与坏字符移动合并进行处理 ,从而尽量利用已有信息进行更大的尝试位置移动 ,使算法具有更高的效率。对IBM... 在对著名的Boyer -Moore串匹配算法进行分析后 ,对BM算法中的尝试位置移动处理部分进行改进 ,提出了IBM算法。该算法将好后缀移动与坏字符移动合并进行处理 ,从而尽量利用已有信息进行更大的尝试位置移动 ,使算法具有更高的效率。对IBM算法进行复杂度分析 ,对BM算法、KMP算法和IBM算法进行实际性能比较 ,结果表明IBM算法的平均运行时间明显优于BM算法与KMP算法。 展开更多
关键词 BM串匹配算法 KMP算法 IBM算法 计算机
在线阅读 下载PDF
一种改进的字符串匹配算法 被引量:26
15
作者 王成 刘金刚 《计算机工程》 CAS CSCD 北大核心 2006年第2期62-64,共3页
基于字符串匹配的检测方法是入侵检测系统中的一种重要方法。在分析了几种常见的字符串匹配算法(BF、KMP、BM、Sunday等)的基础上,提出了一种改进的字符串匹配算法——SundayNew。该算法使每一次匹配不成功后都能跳过尽可能多的字符以... 基于字符串匹配的检测方法是入侵检测系统中的一种重要方法。在分析了几种常见的字符串匹配算法(BF、KMP、BM、Sunday等)的基础上,提出了一种改进的字符串匹配算法——SundayNew。该算法使每一次匹配不成功后都能跳过尽可能多的字符以进行下一轮匹配,并且匹配次数大大减少,从而提高了匹配效率。最后,分析了该算法的性能,并用具体的实验数据给出了几种匹配算法的测试结果。 展开更多
关键词 字符串搜索 模式匹配 算法
在线阅读 下载PDF
一种用于内容过滤和检测的快速多关键词识别算法 被引量:22
16
作者 宋华 戴一奇 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期940-945,共6页
基于字符串匹配的检测方法是内容过滤和检测系统中一类很重要的分析方法 首先分析了现有的几种快速字符串匹配算法 ,然后提出了一种新的多模式字符串匹配算法 ,并简单分析了算法的复杂性 算法在设计的过程中吸取了BM算法中跳跃的特性 ... 基于字符串匹配的检测方法是内容过滤和检测系统中一类很重要的分析方法 首先分析了现有的几种快速字符串匹配算法 ,然后提出了一种新的多模式字符串匹配算法 ,并简单分析了算法的复杂性 算法在设计的过程中吸取了BM算法中跳跃的特性 ,采用了后缀树算法得到了最大跳跃值 ,采用AC算法的匹配自动机原理从而避免对搜索树内每一个字符的匹配 最后 ,通过具体的实验数据验证了这些算法的性能 通过实验可以看出 ,新算法使得检测速度有很大提高 。 展开更多
关键词 内容过滤和检测 字符串匹配算法 多模式字符串匹配算法
在线阅读 下载PDF
一种新的快速移动单模式匹配算法 被引量:10
17
作者 何畏 汪荣贵 查全民 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期665-669,共5页
针对单模式匹配算法BM算法中平均移动距离较小的特性,文章对BM算法进行改进,提出了一种新的可以增加平均移动距离的字符串匹配算法BMN算法。该算法首先在预处理阶段使用任意的2个字符作为字符块来计算移动距离,并设置最大移动距离为模... 针对单模式匹配算法BM算法中平均移动距离较小的特性,文章对BM算法进行改进,提出了一种新的可以增加平均移动距离的字符串匹配算法BMN算法。该算法首先在预处理阶段使用任意的2个字符作为字符块来计算移动距离,并设置最大移动距离为模式串长度加1;然后在查找阶段通过比较连续的2个字符块来增加大距离移动的概率。实验表明,无论模式串的长短,所提出的算法对于英文文本和二进制串均具有较快的速度。 展开更多
关键词 模式匹配 BM算法 字符串 BMN算法
在线阅读 下载PDF
基于内容的网络信息安全审计中的匹配算法研究 被引量:9
18
作者 陈国龙 陈火旺 康仲生 《小型微型计算机系统》 CSCD 北大核心 2004年第9期1676-1679,共4页
对流经网络的 WWW、E- mail、BBS和 FTP报文提出信息审计的方法 ,针对系统字符集比较大、模式串中出现的字符较少的情况下 ,提出一种改进的模式匹配算法 。
关键词 报文审计 匹配算法 BM(Boyer-Moore)算法
在线阅读 下载PDF
改进的AC-BM字符串匹配算法 被引量:21
19
作者 万国根 秦志光 《电子科技大学学报》 EI CAS CSCD 北大核心 2006年第4期531-533,541,共4页
提出了改进的AC-BM算法,将待匹配的字符串集合转换为一个类似于Aho-Corasick算法的树状有限状态自动机。匹配时,采取自后向前的方法,并借用BM算法的坏字符跳转和好前缀跳转技术。改进的AC-BM算法借助BMH算法思想,取消了原AC-BM算法的好... 提出了改进的AC-BM算法,将待匹配的字符串集合转换为一个类似于Aho-Corasick算法的树状有限状态自动机。匹配时,采取自后向前的方法,并借用BM算法的坏字符跳转和好前缀跳转技术。改进的AC-BM算法借助BMH算法思想,取消了原AC-BM算法的好前缀跳转,并对坏字符跳转部分的计算进行优化。新算法修改了skip的计算方法,不再保留每个节点的好前缀跳转参数及坏字符跳转参数,因此匹配只与当前匹配字符有关,而与当前节点无关,可以实现大小写正文的识别。 展开更多
关键词 算法 字符串匹配 内容分析 入侵检测
在线阅读 下载PDF
分布式存储的并行串匹配算法的设计与分析 被引量:10
20
作者 陈国良 林洁 顾乃杰 《软件学报》 EI CSCD 北大核心 2000年第6期771-778,共8页
并行串匹配算法的研究大都集中在 PRAM(parallel random access machine)模型上 ,其他更为实际的模型上的并行串匹配算法的研究相对要薄弱得多 .该文采用将最优串行算法并行化的技术 ,利用模式串的周期性质 ,巧妙地将改进的 KMP(Knuth- ... 并行串匹配算法的研究大都集中在 PRAM(parallel random access machine)模型上 ,其他更为实际的模型上的并行串匹配算法的研究相对要薄弱得多 .该文采用将最优串行算法并行化的技术 ,利用模式串的周期性质 ,巧妙地将改进的 KMP(Knuth- Morris- Pratt)算法并行化 ,提出了一个简便、高效且具有良好可扩放性的分布式串匹配算法 ,其计算复杂度为 O(n/ p+m) ,通信复杂度为 O(ulogp) ,其中 n为文本串长 ,m为模式串长 ,u为模式串最小周期长 ,p为处理器数 . 展开更多
关键词 串匹配 KMP(Knuth-Morris-Pratt) 分布式算法 可扩放性
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部