期刊文献+
共找到177篇文章
< 1 2 9 >
每页显示 20 50 100
Parallel Quick Search Algorithm for the Exact String Matching Problem Using OpenMP
1
作者 Sinan Sameer Mahmood Al-Dabbagh Nawaf Hazim Barnouti +1 位作者 Mustafa Abdul Sahib Naser Zaid G. Ali 《Journal of Computer and Communications》 2016年第13期1-11,共11页
String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that... String matching is seen as one of the essential problems in computer science. A variety of computer applications provide the string matching service for their end users. The remarkable boost in the number of data that is created and kept by modern computational devices influences researchers to obtain even more powerful methods for coping with this problem. In this research, the Quick Search string matching algorithm are adopted to be implemented under the multi-core environment using OpenMP directive which can be employed to reduce the overall execution time of the program. English text, Proteins and DNA data types are utilized to examine the effect of parallelization and implementation of Quick Search string matching algorithm on multi-core based environment. Experimental outcomes reveal that the overall performance of the mentioned string matching algorithm has been improved, and the improvement in the execution time which has been obtained is considerable enough to recommend the multi-core environment as the suitable platform for parallelizing the Quick Search string matching algorithm. 展开更多
关键词 string matching Pattern matching string Searching algorithmS Quick Search algorithm Exact string matching algorithm ? Parallelization OPENMP
在线阅读 下载PDF
The Factors Analysis and Algorithm Implementation of Single-pattern Matching
2
作者 刘功申 朱圣军 《Journal of Shanghai Jiaotong university(Science)》 EI 2009年第3期331-337,共7页
By studying the algorithms of single pattern matching, five factors that have effect on time complexity of the algorithm are analyzed. The five factors are: sorting the characters of pattern string in an increasing o... By studying the algorithms of single pattern matching, five factors that have effect on time complexity of the algorithm are analyzed. The five factors are: sorting the characters of pattern string in an increasing order of using frequency, utilizing already-matched pattern suffix information, utilizing already-matched pattern prefix information, utilizing the position factor which is absorbed from quick search algorithm, and utilizing the continue-skip idea which is originally proposed by this paper. Combining all the five factors, a new single pattern matching algorithm is implemented. It's proven by the experiment that the efficiency of new algorithm is the best of all algorithms. 展开更多
关键词 single pattern matching string search algorithm analysis
原文传递
A Fast Pattern Matching Algorithm Using Changing Consecutive Characters
3
作者 Amjad Hudaib Dima Suleiman Arafat Awajan 《Journal of Software Engineering and Applications》 2016年第8期399-411,共13页
Pattern matching is a very important algorithm used in many applications such as search engine and DNA analysis. They are aiming to find a pattern in a text. This paper proposes a Pattern Matching Algorithm Using Chan... Pattern matching is a very important algorithm used in many applications such as search engine and DNA analysis. They are aiming to find a pattern in a text. This paper proposes a Pattern Matching Algorithm Using Changing Consecutive Characters (PMCCC) to make the searching pro- cess of the algorithm faster. PMCCC enhances the shift process that determines how the pattern moves in case of the occurrence of the mismatch between the pattern and the text. It enhances the Berry Ravindran (BR) shift function by using m consecutive characters where m is the pattern length. The formal basis and the algorithms are presented. The experimental results show that PMCCC made enhancements in searching process by reducing the number of comparisons and the number of attempts. Comparing the results of PMCCC with other related algorithms has shown significant enhancements in average number of comparisons and average number of attempts. 展开更多
关键词 PATTERN Pattern matching algorithms string matching Berry Ravindran EBR RS-A Fast Pattern matching algorithms
在线阅读 下载PDF
CUSMART:effective parallelization of stringmatching algorithms using GPGPU accelerators
4
作者 Adnan OZSOY Mengu NAZLI +1 位作者 Onur CANKUR Cagri SAHIN 《Frontiers of Information Technology & Electronic Engineering》 2025年第6期877-895,共19页
This study presents a parallel version of the string matching algorithms research tool(SMART)library,implemented on NVIDIA’s compute unified device architecture(CUDA)platform,and uses general-purpose computing on gra... This study presents a parallel version of the string matching algorithms research tool(SMART)library,implemented on NVIDIA’s compute unified device architecture(CUDA)platform,and uses general-purpose computing on graphics processing unit(GPGPU)programming concepts to enhance performance and gain insight into the parallel versions of these algorithms.We have developed the CUDA-enhanced SMART(CUSMART)library,which incorporates parallelized iterations of 64 string matching algorithms,leveraging the CUDA application programming interface.The performance of these algorithms has been assessed across various scenarios to ensure a comprehensive and impartial comparison,allowing for the identification of their strengths and weaknesses in specific application contexts.We have explored and established optimization techniques to gauge their influence on the performance of these algorithms.The results of this study highlight the potential of GPGPU computing in string matching applications through the scalability of algorithms,suggesting significant performance improvements.Furthermore,we have identified the best and worst performing algorithms in various scenarios. 展开更多
关键词 string matching Parallel programming Graphics processing unit(GPU)programming General-purpose computing on GPU(GPGPU) NVIDIA Compute unified device architecture(CUDA) string matching algorithms research tool(SMART)
原文传递
对QS串匹配算法的一种改进 被引量:2
5
作者 李雪梅 代六玲 +1 位作者 童新海 王雄 《计算机应用与软件》 CSCD 北大核心 2006年第3期108-109,130,共3页
本文提出一种改进的QS算法IQS。基于CPU进行一次字节长度的字符比较和进行一次机器字长长度的整数比较所花费的时间完全相同的事实,以及QS算法对当前尝试中比较顺序和匹配失败位置不关心的特点,IQS将字符比较映射到整数域进行。由于比... 本文提出一种改进的QS算法IQS。基于CPU进行一次字节长度的字符比较和进行一次机器字长长度的整数比较所花费的时间完全相同的事实,以及QS算法对当前尝试中比较顺序和匹配失败位置不关心的特点,IQS将字符比较映射到整数域进行。由于比较次数被成倍减少,算法的平均复杂度被降低,效率相应得到提高。在真实语料上的实验结果表明,IQS算法的匹配速度明显高于QS算法。 展开更多
关键词 串匹配 qs算法 iqs算法
在线阅读 下载PDF
一种改进的QS串匹配算法 被引量:3
6
作者 曾传璜 段智宏 《计算机与数字工程》 2010年第7期48-49,88,共3页
在分析QS算法的基础上,提出了一种新的改进算法—EQS算法。该算法在模式匹配成功时用一个字符来确定右移量,在匹配失败时用两个字符来确定右移量。实验结果表明:该算法使模式串的右移量增大、匹配次数减少,达到提高算法效率的目的。
关键词 模式匹配 qs算法 模式串
在线阅读 下载PDF
改进的QS模式匹配算法的性能分析 被引量:2
7
作者 巫喜红 《计算机工程与应用》 CSCD 2014年第2期44-48,共5页
在详细分析QS匹配算法的基础上,提出了一种改进的算法I_QS算法。I_QS算法把模式串中每相邻两个字符构成一个字符串,由这些字符串组成字符串表并确定其位置,同时通过当前匹配窗口的后三个字符来确定下一次的右移量。为了分析I_QS算法的性... 在详细分析QS匹配算法的基础上,提出了一种改进的算法I_QS算法。I_QS算法把模式串中每相邻两个字符构成一个字符串,由这些字符串组成字符串表并确定其位置,同时通过当前匹配窗口的后三个字符来确定下一次的右移量。为了分析I_QS算法的性能,从不同模式串数目角度,对I_QS算法进行匹配所需要的时间、所尝试的次数、所比较的字符个数三方面进行实验。实验结果表明,由于I_QS算法能够最大限度地向右移动,从而大大地减少移动次数和缩短匹配时间,有效地提高模式匹配速度。 展开更多
关键词 快速搜索(qs)算法 改进的快速搜索(I-qs)算法 性能 模式匹配
在线阅读 下载PDF
针对QSP算法的研究与分析 被引量:1
8
作者 李莉 江育娥 林劼 《计算机系统应用》 2016年第3期28-33,共6页
BM算法是经典的单模式匹配算法,QS算法是基于BM算法的改进算法,由于QS算法仅仅分析下一字符T[j+m]计算右移量,整体的匹配效率并不高,因此在QS算法的基础上提出一种改进算法(QSP).QSP算法在预处理阶段从左向右找出模式串中出现1次以上的... BM算法是经典的单模式匹配算法,QS算法是基于BM算法的改进算法,由于QS算法仅仅分析下一字符T[j+m]计算右移量,整体的匹配效率并不高,因此在QS算法的基础上提出一种改进算法(QSP).QSP算法在预处理阶段从左向右找出模式串中出现1次以上的单字符,计算出这些字符的跳转期望值差,得到最大差值和相对应的字符位置max Pos,并修改skipp2数组的值;在匹配阶段,首先比较P[max Pos]与T[j+max Pos]是否相等,然后再利用两个数组skipp1和skipp2进行右移,保证每次右移的距离达到最大.通过实验证明,该算法总的比较次数和运行时间都低于QS算法,匹配效率得到明显的提高. 展开更多
关键词 模式匹配 qs算法 qsP算法 跳转期望值差
在线阅读 下载PDF
Memory Efficient String Matching Algorithm for Network Intrusion Management System 被引量:9
9
作者 余建明 薛一波 李军 《Tsinghua Science and Technology》 SCIE EI CAS 2007年第5期585-593,共9页
As the core algorithm and the most time consuming part of almost every modern network intrusion management system (NIMS), string matching is essential for the inspection of network flows at the line speed. This pape... As the core algorithm and the most time consuming part of almost every modern network intrusion management system (NIMS), string matching is essential for the inspection of network flows at the line speed. This paper presents a memory and time efficient string matching algorithm specifically designed for NIMS on commodity processors. Modifications of the Aho-Corasick (AC) algorithm based on the distribution characteristics of NIMS patterns drastically reduce the memory usage without sacrificing speed in software implementations. In tests on the Snort pattern set and traces that represent typical NIMS workloads, the Snort performance was enhanced 1.48%-20% compared to other well-known alternatives with an automaton size reduction of 4.86-6.11 compared to the standard AC implementation. The results show that special characteristics of the NIMS can be used into a very effective method to optimize the algorithm design. 展开更多
关键词 string matching network intrusion management system (NIMS) Aho-Corasick (AC) algorithm
原文传递
基于QS算法的改进算法QS_I
10
作者 李莉 《现代计算机》 2018年第18期25-29,共5页
BM算法、QS算法是经典的基于字符匹配的单模式算法,QSP算法是QS算法的一种改进算法,但是模式串的最大右移量只为m+1,具有一定的局限性。QS_I是基于QS算法提出的另一种改进算法,QS_I算法不仅用单字符考虑当前窗口不匹配的可能性,还预测... BM算法、QS算法是经典的基于字符匹配的单模式算法,QSP算法是QS算法的一种改进算法,但是模式串的最大右移量只为m+1,具有一定的局限性。QS_I是基于QS算法提出的另一种改进算法,QS_I算法不仅用单字符考虑当前窗口不匹配的可能性,还预测下次窗口跳转的距离,最大右移量为m+1+SHIFT_1,通过实验证明QS_I算法的运行效率明显高于QS算法和QSP算法。 展开更多
关键词 单模式匹配 qs算法 qs_I算法
在线阅读 下载PDF
一种计算存储设备中的字符串并行匹配算法
11
作者 张东阳 刘东石 +2 位作者 苏攀 马玉梅 王其乐 《计算机技术与发展》 2025年第8期25-35,共11页
传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最... 传统的字符串匹配算法在遭遇最不利情况时时间消耗显著攀升,成为性能瓶颈,此外还往往伴随大量数据的频繁迁移与操作,当面临数据密集型应用和输入输出(IO)性能限制时,其局限性愈发凸显。针对传统字符串匹配解决方案中的数据移动量大、最差情况下的性能瓶颈等问题,提出了基于计算存储设备(Computational Storage Device,CSD)的解决方法。该方法通过在存储器内部部署嵌入式处理引擎,将计算移动到存储端,大幅减少了数据在处理单元和存储单元之间的传输,从而显著提升了整体计算效率。将现场可编程门阵列(Field Programmable Gate Array,FPGA)作为CSD嵌入式处理引擎,利用其并行处理能力,设计了一种高效的精确字符串并行匹配算法。在FPGA读取数据的同时,完成字符串匹配工作,消除了字符串匹配过程中的额外时间开销。实验结果表明,基于CSD的解决方法展现出了显著的性能优势,为大数据环境下的字符串匹配问题提供了一种新的解决方案。 展开更多
关键词 字符串匹配 计算存储设备 现场可编程门阵列 并行 算法
在线阅读 下载PDF
基于局部标签树匹配的网页相似度去重算法
12
作者 邱紫韵 《西安文理学院学报(自然科学版)》 2025年第2期16-21,共6页
当搜索引擎进行网页相似度去重时,可能会使相似的内容被合并为一个链接,导致搜索结果的精确率降低,用户难以找到真正希望找到的页面.为优化搜索引擎、提高用户体验,提出基于局部标签树匹配的网页相似度去重算法.利用爬虫技术抓取网络中... 当搜索引擎进行网页相似度去重时,可能会使相似的内容被合并为一个链接,导致搜索结果的精确率降低,用户难以找到真正希望找到的页面.为优化搜索引擎、提高用户体验,提出基于局部标签树匹配的网页相似度去重算法.利用爬虫技术抓取网络中的网页内容,将这些网页的HTML结构解析成标签树的形式,每个节点代表一个HTML标签.针对每个标签节点,采用基于词频-逆文本频率算法筛选关键词,并利用关键词提取关键句,从而获取网页局部标签树的特征串.采用LCS算法遍历整个局部标签树,计算不同标签节点之间的相似度,剔除相似度较高的网页,即可完成网页相似度去重.经实验验证:该算法可以高效率地完成特征串提取,在去重时F值与召回率均保持在95%以上,可以有效地实现网页相似度去重工作. 展开更多
关键词 局部标签树匹配 网页相似度去重 LCS算法 特征串
在线阅读 下载PDF
一种改进的KMP高效模式匹配算法 被引量:27
13
作者 鲁宏伟 魏凯 孔华锋 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第10期41-43,共3页
针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳... 针对KMP算法存在着主串与模式串中多个相同字符重复比较的缺陷,在KMP算法的基础上,给出了一种新的模式匹配算法,该算法不像KMP算法那样向左滑动模式串的指针,而是每次比较字符不匹配时,根据模式串当前字符的特征值k,使主串的指针向前跳跃k个值,且使模式串的指针置于起始位置,开始新一轮的匹配,加快了主串的匹配速度.理论分析和试验证明,该算法需要的比较次数比KMP算法减少将近一半. 展开更多
关键词 模式匹配 算法 模式串 主串 时间复杂度
在线阅读 下载PDF
改进的多模式字符串匹配算法 被引量:11
14
作者 蔡晓妍 戴冠中 杨黎斌 《计算机应用》 CSCD 北大核心 2007年第6期1415-1417,共3页
在经典的AC多模式字符串匹配算法的基础上,结合BMH算法的优点,提出了一种快速的多模式字符串匹配算法。一般情况下,该算法不需要匹配目标文本串中的每个字符,而是在实际比较之前跳过尽可能多的字符,以减少字符比较的操作,实现快速匹配... 在经典的AC多模式字符串匹配算法的基础上,结合BMH算法的优点,提出了一种快速的多模式字符串匹配算法。一般情况下,该算法不需要匹配目标文本串中的每个字符,而是在实际比较之前跳过尽可能多的字符,以减少字符比较的操作,实现快速匹配。在模式串较长和较短的情况下,算法都有很好的性能。实验表明,在模式串较短时,本算法所需的时间仅为AC算法的50%~30%;在模式串较长时,所需时间为AC算法的26.7%~15.2%。 展开更多
关键词 字符串匹配 AC算法 BMH算法 多模式匹配 算法复杂度
在线阅读 下载PDF
一种时间复杂度最优的精确串匹配算法 被引量:25
15
作者 贺龙涛 方滨兴 余翔湛 《软件学报》 EI CSCD 北大核心 2005年第5期676-683,共8页
现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地... 现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(logσm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用. 展开更多
关键词 后缀自动机 有限状态自动机 LDM算法 串匹配 复杂度分析
在线阅读 下载PDF
一种快速的字符串匹配算法 被引量:25
16
作者 钱屹 侯义斌 《小型微型计算机系统》 CSCD 北大核心 2004年第3期410-413,共4页
字符串匹配技术在许多领域里广泛应用 ,本文在分析了 BF、BM算法以及一些重要的改进算法的基础上 ,提出了一种新的改进算法—— BMH2 C,该算法利用两个字符计算右移量并保存在二维数组里 ,使右移量增大 ,比较次数减少 ,有效地提高了匹... 字符串匹配技术在许多领域里广泛应用 ,本文在分析了 BF、BM算法以及一些重要的改进算法的基础上 ,提出了一种新的改进算法—— BMH2 C,该算法利用两个字符计算右移量并保存在二维数组里 ,使右移量增大 ,比较次数减少 ,有效地提高了匹配速度 . 展开更多
关键词 模式匹配 字符串检索 字符串匹配算法 BMH2C算法 BF算法 BM算法
在线阅读 下载PDF
一种改进的多关键字匹配算法 被引量:4
17
作者 代六玲 王树梅 +1 位作者 黄河燕 陈肇雄 《南京理工大学学报》 EI CAS CSCD 北大核心 2005年第6期735-739,共5页
基于多关键字匹配的Sun Wu算法进行的分析,结合QS算法的思想,设计了一种改进的多关键字匹配算法:QMS(quick multi-pattern searching)。算法使用散列技术和前缀表减少发生部分匹配时实际进行的关键字比较次数。在计算跳跃距离时,充分考... 基于多关键字匹配的Sun Wu算法进行的分析,结合QS算法的思想,设计了一种改进的多关键字匹配算法:QMS(quick multi-pattern searching)。算法使用散列技术和前缀表减少发生部分匹配时实际进行的关键字比较次数。在计算跳跃距离时,充分考虑当前窗口的紧邻下一个字符带来的信息,进而使用更加精确的跳跃距离计算方法以获得更大的平均跳跃距离,从而获得更高的扫描效率和空间利用率。在真实文本上的对比实验表明,在通常应用环境中,该算法显著的缩短了扫描时间,取得了很好的效果。 展开更多
关键词 多关键字匹配 BM算法 qs算法 SUN Wu算法
在线阅读 下载PDF
对BM串匹配算法的一个改进 被引量:9
18
作者 贺龙涛 方滨兴 胡铭曾 《计算机应用》 CSCD 北大核心 2003年第3期6-8,12,共4页
在对著名的Boyer -Moore串匹配算法进行分析后 ,对BM算法中的尝试位置移动处理部分进行改进 ,提出了IBM算法。该算法将好后缀移动与坏字符移动合并进行处理 ,从而尽量利用已有信息进行更大的尝试位置移动 ,使算法具有更高的效率。对IBM... 在对著名的Boyer -Moore串匹配算法进行分析后 ,对BM算法中的尝试位置移动处理部分进行改进 ,提出了IBM算法。该算法将好后缀移动与坏字符移动合并进行处理 ,从而尽量利用已有信息进行更大的尝试位置移动 ,使算法具有更高的效率。对IBM算法进行复杂度分析 ,对BM算法、KMP算法和IBM算法进行实际性能比较 ,结果表明IBM算法的平均运行时间明显优于BM算法与KMP算法。 展开更多
关键词 BM串匹配算法 KMP算法 IBM算法 计算机
在线阅读 下载PDF
一种基于熵的文本相似性计算方法 被引量:13
19
作者 李圣文 凌微 +1 位作者 龚君芳 周长征 《计算机应用研究》 CSCD 北大核心 2016年第3期665-668,共4页
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法... 文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。 展开更多
关键词 文本相似性 字符串匹配 编辑距离算法 最长公共子序列
在线阅读 下载PDF
一种新的快速移动单模式匹配算法 被引量:10
20
作者 何畏 汪荣贵 查全民 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期665-669,共5页
针对单模式匹配算法BM算法中平均移动距离较小的特性,文章对BM算法进行改进,提出了一种新的可以增加平均移动距离的字符串匹配算法BMN算法。该算法首先在预处理阶段使用任意的2个字符作为字符块来计算移动距离,并设置最大移动距离为模... 针对单模式匹配算法BM算法中平均移动距离较小的特性,文章对BM算法进行改进,提出了一种新的可以增加平均移动距离的字符串匹配算法BMN算法。该算法首先在预处理阶段使用任意的2个字符作为字符块来计算移动距离,并设置最大移动距离为模式串长度加1;然后在查找阶段通过比较连续的2个字符块来增加大距离移动的概率。实验表明,无论模式串的长短,所提出的算法对于英文文本和二进制串均具有较快的速度。 展开更多
关键词 模式匹配 BM算法 字符串 BMN算法
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部