期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
HashTrie Functional Framework and Its Application in Chinese-English Pattern Matching
1
作者 ZUO Zhengkang ZHOU Chao +1 位作者 ZENG Zhicheng WANG Changjing 《Wuhan University Journal of Natural Sciences》 2025年第2期184-194,共11页
Most existing multi-pattern matching algorithms are designed for single English texts leading to issues such as missed matches and space expansion when applied to Chinese-English mixed-text environments.The Hash Trie-... Most existing multi-pattern matching algorithms are designed for single English texts leading to issues such as missed matches and space expansion when applied to Chinese-English mixed-text environments.The Hash Trie-based matching machine demonstrates strong compatibility with both Chinese and English,ensuring high accuracy in text processing and subtree positioning.In this study,a novel functional framework based on the HashTrie structure is proposed and mechanically verified using Isabelle/HOL.This framework is applied to design Functional Multi-Pattern Matching(FMPM),the first functional multi-pattern matching algorithm for Chinese-English mixed texts.FMPM constructs the HashTrie matching machine using character codes and threads the machine according to the associations between pattern strings.The experimental results show that as the stored string information increases,the proposed algorithm demonstrates more significant optimization in retrieval efficiency.FMPM simplifies the implementation of the Threaded Hash Trie(THT)for Chinese-English mixed texts,effectively reducing the uncertainties in the transition from the algorithm description to code implementation.FMPM addresses the problem of space explosion Chinese-English mixed texts and avoids issues such as bound variable iteration errors.The functional framework of the HashTrie structure serves as a reference for the formal verification of future HashTrie-based algorithms. 展开更多
关键词 multi-pattern matching Chinese-English mixed HashTrie FUNCTIONAL mechanized verification
原文传递
A Fast Multi-Pattern Matching Algorithm for Mining Big Network Data 被引量:3
2
作者 Jun Liu Guangkuo Bian +1 位作者 Chao Qin Wenhui Lin 《China Communications》 SCIE CSCD 2019年第5期121-136,共16页
The rapid development of mobile network brings opportunities for researchers to analyze user behaviors based on largescale network traffic data. It is important for Internet Service Providers(ISP) to optimize resource... The rapid development of mobile network brings opportunities for researchers to analyze user behaviors based on largescale network traffic data. It is important for Internet Service Providers(ISP) to optimize resource allocation and provide customized services to users. The first step of analyzing user behaviors is to extract information of user actions from HTTP traffic data by multi-pattern URL matching. However, the efficiency is a huge problem when performing this work on massive network traffic data. To solve this problem, we propose a novel and accurate algorithm named Multi-Pattern Parallel Matching(MPPM) that takes advantage of HashMap in data searching for extracting user behaviors from big network data more effectively. Extensive experiments based on real-world traffic data prove the ability of MPPM algorithm to deal with massive HTTP traffic with better performance on accuracy, concurrency and efficiency. We expect the proposed algorithm and it parallelized implementation would be a solid base to build a high-performance analysis engine of user behavior based on massive HTTP traffic data processing. 展开更多
关键词 HTTP TRAFFIC multi-patterns matching SPARK URL matching USER behavior
在线阅读 下载PDF
Multi-Pattern Matching Algorithm with Wildcards Based on Bit-Parallelism
3
作者 Ahmed A. F. Saif HU Liang CHU Jianfeng 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2017年第2期178-184,共7页
Multi-pattern matching with wildcards is a problem of finding the occurrence of all patterns in a pattern set {p^1,… ,p^k} in a given text t. If the percentage of wildcards in pattern set is not high, this problem ca... Multi-pattern matching with wildcards is a problem of finding the occurrence of all patterns in a pattern set {p^1,… ,p^k} in a given text t. If the percentage of wildcards in pattern set is not high, this problem can be solved using finite automata. We introduce a multi-pattern matching algorithm with a fixed number of wildcards to overcome the high percentage of the occurrence of wildcards in patterns. In our proposed method, patterns are matched as bit patterns using a sliding window approach. The window is a bit window that slides along the given text, matching against stored bit patterns. Matching process is executed using bit wise operations. The experimental results demonstrate that the percentage of wildcard occurrence does not affect the proposed algorithm's performance and the proposed algorithm is more efficient than the algorithms based on the fast Fourier transform. The proposed algorithm is simple to implement and runs efficiently in O(n + d(n/σ )(m/w)) time, where n is text length, d is symbol distribution over k patterns, m is pattern length, and σ is alphabet size. 展开更多
关键词 multi-pattern string matching WILDCARD bitparallelism
原文传递
基于藏文音节特征的WM多模式匹配算法
4
作者 杨媛婷 彭展 《科技创新与应用》 2025年第8期1-5,共5页
近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manb... 近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manber)算法以其良好的实际表现,在许多场景都得到广泛应用,该算法使用字符块跳转技术来加速匹配过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法用于藏文多模式匹配,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法进行改进和优化,提出适用于藏文的多模式匹配算法——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法在藏文多模式匹配任务中,相比原始WM算法在效率和准确性上都有显著提高。 展开更多
关键词 多模式匹配 wm算法 藏文处理 藏文音节 音节结构特性
在线阅读 下载PDF
基于WM算法的多模式匹配改进算法WMN 被引量:7
5
作者 袁世忠 曹旻 王燕燕 《计算机工程与应用》 CSCD 北大核心 2007年第15期128-130,143,共4页
入侵检测系统中有部分时间用来进行模式匹配,因此提高模式匹配算法的处理速度具有重要的意义。从两个方面改进了目前公认效率较高的多模式匹配算法WM,设计出WMN算法,并对该算法进行了性能测试和分析。实验证明该文提出的WMN算法能够有... 入侵检测系统中有部分时间用来进行模式匹配,因此提高模式匹配算法的处理速度具有重要的意义。从两个方面改进了目前公认效率较高的多模式匹配算法WM,设计出WMN算法,并对该算法进行了性能测试和分析。实验证明该文提出的WMN算法能够有效提高模式匹配的处理速度。 展开更多
关键词 模式匹配算法 wm算法 wmN算法
在线阅读 下载PDF
基于后缀WM匹配算法的改进算法 被引量:6
6
作者 蒋晓鸽 武小年 张昭 《计算机与数字工程》 2013年第4期608-610,共3页
针对基于后缀WM匹配算法中的字符重复匹配问题,给出了相应的改进算法。该算法针对扫描阶段确定的与模式串前缀、后缀和前m个字符的后缀都相同的文本串字符块,在匹配阶段跳过文本串字符块中已经确定的字符块,避免了对已经确定的字符块的... 针对基于后缀WM匹配算法中的字符重复匹配问题,给出了相应的改进算法。该算法针对扫描阶段确定的与模式串前缀、后缀和前m个字符的后缀都相同的文本串字符块,在匹配阶段跳过文本串字符块中已经确定的字符块,避免了对已经确定的字符块的重复匹配,减少匹配开销。实验结果表明,相对于原始算法,改进算法降低了系统匹配的运行时间,提高了系统运行的效率。 展开更多
关键词 多模式匹配 wm算法 前缀 后缀
在线阅读 下载PDF
WM与MWM算法分析
7
作者 燕红文 杨怀卿 《农业网络信息》 2013年第12期52-54,共3页
以经典的多模式匹配算法为例,对多模式匹配算法进行了分析,并阐述了其详细的实现过程。对于修改后的多模式匹配算法分析了其优缺点,为该算法的继续改进提供了一定的参考意见。
关键词 wm 模式匹配 多模式 Mwm
在线阅读 下载PDF
BM算法与WM算法的比较
8
作者 马永强 《集宁师专学报》 2011年第4期48-52,共5页
模式匹配算法比较成熟,但是传统的模式匹配算法对提高Snort检测性能的效果不是十分有效。Snort采用的BM算法是一种单模式匹配算法,目前研究者对Snort模式匹配算法的研究和改进主要是采用多模式匹配算法来替换原有的BM算法。本文主要介绍... 模式匹配算法比较成熟,但是传统的模式匹配算法对提高Snort检测性能的效果不是十分有效。Snort采用的BM算法是一种单模式匹配算法,目前研究者对Snort模式匹配算法的研究和改进主要是采用多模式匹配算法来替换原有的BM算法。本文主要介绍了BM算法和WM算法,分析了这两种算法的基本原理并进行了一些相关的比较。 展开更多
关键词 模式匹配 SNORT BM wm
在线阅读 下载PDF
海量模式高效匹配方法研究 被引量:17
9
作者 张宏莉 徐东亮 +1 位作者 梁敏 刘宇峰 《电子学报》 EI CAS CSCD 北大核心 2014年第6期1220-1224,共5页
本文提出了一种基于随机指纹模型的Wu and Manber(WM)算法(Randomizing Fingerprint WM,RFPWM),它通过为每一个模式串计算唯一指纹可以有效降低误报率.与WM算法相比,RFP-WM算法极大地降低了哈希冲突率,提高了命中率,在海量模式集上这一... 本文提出了一种基于随机指纹模型的Wu and Manber(WM)算法(Randomizing Fingerprint WM,RFPWM),它通过为每一个模式串计算唯一指纹可以有效降低误报率.与WM算法相比,RFP-WM算法极大地降低了哈希冲突率,提高了命中率,在海量模式集上这一效果更为显著.实验结果表明,相对于传统WM算法,该算法的匹配效率更高,而且模式集的规模越大,性能越优越. 展开更多
关键词 指纹模型 模式匹配 指纹Wu and Manber(wm)算法
在线阅读 下载PDF
“垃圾短信”监控的中文多模式模糊匹配算法 被引量:4
10
作者 秦建 孙秀锋 吴春明 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期168-172,共5页
针对"垃圾短信"中有害关键字的4种常见伪装方法,提出了"垃圾短信"监控的中文多模式模糊匹配算法.首先进行关键字和检测短信的模糊化预处理,然后运用WM算法进行中文信息的初步匹配,最后进行多模式匹配.实验证明,该... 针对"垃圾短信"中有害关键字的4种常见伪装方法,提出了"垃圾短信"监控的中文多模式模糊匹配算法.首先进行关键字和检测短信的模糊化预处理,然后运用WM算法进行中文信息的初步匹配,最后进行多模式匹配.实验证明,该算法在执行效率等方面均优于原有系统中的算法. 展开更多
关键词 垃圾短信 wm算法 多模式匹配 中文模糊匹配 中文短信监测
原文传递
一种面向云中心网络入侵检测的多模式匹配算法 被引量:6
11
作者 赵国锋 叶飞 +1 位作者 姚永安 赵岩 《信息网络安全》 CSCD 北大核心 2018年第1期52-57,共6页
云中心网络的流量和字符串模式集规模非常庞大,给入侵检测系统带来巨大挑战。为了解决WM(Wu-Manber)多模式串匹配算法匹配效率和匹配成功率较低的问题,同时降低最短模式串长度对算法匹配的影响,文章提出了一种基于WM算法的改进算法——I... 云中心网络的流量和字符串模式集规模非常庞大,给入侵检测系统带来巨大挑战。为了解决WM(Wu-Manber)多模式串匹配算法匹配效率和匹配成功率较低的问题,同时降低最短模式串长度对算法匹配的影响,文章提出了一种基于WM算法的改进算法——IS_WM(Improved Sunday Wu-Manber),该算法在经典WM算法的基础上,利用字符块跳跃思想以及字符漏匹配思想,使匹配窗口在匹配失效时跳跃移动更大的距离,减少无谓的匹配次数,提高了模式串匹配效率。通过数据测试和搭建敏感词过滤实验系统,表明IS_WM算法具有更低的时间复杂度且匹配效率高,有利于提高云中心网络入侵检测系统的敏感词检索、过滤的能力。 展开更多
关键词 多模式串匹配 wm算法 IS_wm算法 字符跳跃匹配
在线阅读 下载PDF
一种基于编码关联的快速多模式匹配算法 被引量:1
12
作者 朱永强 秦志光 《计算机科学》 CSCD 北大核心 2016年第2期26-30,共5页
多模式匹配算法经常使用有限自动状态机来实现多个模式串的并行匹配。针对基于自动状态机的多模式匹配算法在应用于中文编码时存在的存储空间膨胀问题,使用中文字符的拆分编码构造自动状态机,以优化算法自动状态机的存储空间,并利用中... 多模式匹配算法经常使用有限自动状态机来实现多个模式串的并行匹配。针对基于自动状态机的多模式匹配算法在应用于中文编码时存在的存储空间膨胀问题,使用中文字符的拆分编码构造自动状态机,以优化算法自动状态机的存储空间,并利用中文编码的编码关联性,设计了一种基于编码关联跳转的失效跳转表,使用启发式跳跃规则提升匹配算法的时间性能。最后通过实验证明,中文编码环境下,相比于其它使用自动状态机的多模式匹配算法,改良算法拥有更小的空间消耗与更快的运行速度。 展开更多
关键词 多模式匹配 DFSA算法 wm算法 DFSA-QS算法 编码关联
在线阅读 下载PDF
多模式匹配算法的性能分析 被引量:6
13
作者 孙友仓 《电子设计工程》 2010年第1期17-18,共2页
多模式匹配算法效率直接影响入侵检测系统的性能和效率。在分析研究经典的AC算法、WM算法和ExB算法的基础上,通过上机实验测试这些算法的模式匹配时间,为改进多模式匹配算法提供有益的借鉴。
关键词 多模式匹配 AC算法 wm算法 ExB算法
在线阅读 下载PDF
双向AC算法及其在入侵检测系统中应用 被引量:6
14
作者 杨超 《计算机系统应用》 2011年第3期222-225,共4页
在经典的多模式字符串匹配算法-AC算法的基础上,提出了双向AC算法。该算法在预处理阶段构造正向和反向两个有限状态自动机,匹配时使用正向有限自动机从文本串中间位置向右扫描,同时依据反向有限状态自动机从中间位置向左扫描。将该算法... 在经典的多模式字符串匹配算法-AC算法的基础上,提出了双向AC算法。该算法在预处理阶段构造正向和反向两个有限状态自动机,匹配时使用正向有限自动机从文本串中间位置向右扫描,同时依据反向有限状态自动机从中间位置向左扫描。将该算法应用于开放源码的入侵检测系统Snort中,实验结果表明较BM算法、WM算法和AC算法本算法有更好的时间性能。如使用发现攻击即停止匹配方式检测,则该算法的效率约为AC算法的1.5倍。 展开更多
关键词 AC算法 wm算法 BM算法 串匹配算法 入侵检测系统 SNORT
在线阅读 下载PDF
中文多模式匹配算法性能的分析与研究 被引量:1
15
作者 朱永强 江雪 《计算机技术与发展》 2014年第2期67-70,75,共5页
模式匹配算法一般不具有所有环境下的通用性,不同的算法在不同语义环境下的表现,往往差异较大。为实现中文环境下对模式串的快速多模式匹配,选择出在中文环境下的最优匹配算法,分析了几种经典的多模式匹配算法。通过对各个算法设计思路... 模式匹配算法一般不具有所有环境下的通用性,不同的算法在不同语义环境下的表现,往往差异较大。为实现中文环境下对模式串的快速多模式匹配,选择出在中文环境下的最优匹配算法,分析了几种经典的多模式匹配算法。通过对各个算法设计思路、时间性能与空间性能的研究,推导出基于"坏字符"的算法设计思路最适用于中文环境下大字符集、短字符串的特点,并通过实验对理论推测的中文环境最优算法-Wang算法的性能与其他几种经典算法的性能进行了比较,验证了理论推导的正确性。 展开更多
关键词 多模式匹配 中文环境 AC算法 wm算法 Wang算法
在线阅读 下载PDF
一种基于多模式匹配的文本压缩算法 被引量:3
16
作者 魏星 张磊 吴义国 《现代计算机》 2011年第6期28-30,共3页
基于LZSS算法,提出引入WM多模式匹配思想的压缩算法(WM_LZSS压缩算法),该算法通过一个模式库自动记录在已读入文本中出现过的匹配长度较长的短语,在压缩的过程中预先对文本进行多模式匹配。通过对WM_LZSS算法测试的实验,表明WM_LZSS压... 基于LZSS算法,提出引入WM多模式匹配思想的压缩算法(WM_LZSS压缩算法),该算法通过一个模式库自动记录在已读入文本中出现过的匹配长度较长的短语,在压缩的过程中预先对文本进行多模式匹配。通过对WM_LZSS算法测试的实验,表明WM_LZSS压缩算法在文本文件压缩应用中压缩比比LZSS算法高,特别适合于对文本相似度高的长文件进行压缩。 展开更多
关键词 LZSS压缩算法 模式库 wm多模式匹配
在线阅读 下载PDF
入侵检测中一种新的多模式匹配算法 被引量:8
17
作者 李庚 韩进 谢立 《计算机应用研究》 CSCD 北大核心 2008年第8期2474-2476,共3页
基于模式匹配的检测方法是目前入侵检测系统的一种重要方法,因此作为模式匹配方法核心的字符串匹配算法直接影响入侵检测系统的性能和效率。在AC算法和Wu-Manber算法的研究基础上,提出了一种新的多模式匹配算法——AC-WM。该算法能够增... 基于模式匹配的检测方法是目前入侵检测系统的一种重要方法,因此作为模式匹配方法核心的字符串匹配算法直接影响入侵检测系统的性能和效率。在AC算法和Wu-Manber算法的研究基础上,提出了一种新的多模式匹配算法——AC-WM。该算法能够增加字符跳转距离,比较稳定地减少匹配过程中字符比较的次数,提高匹配的速度和效率。 展开更多
关键词 入侵检测 多模式匹配 AC算法 WU-MANBER算法 AC-wm算法
在线阅读 下载PDF
双向模式匹配在年鉴数据预处理平台中的应用 被引量:2
18
作者 史礼婷 张骞 +2 位作者 钟永恒 胡思思 李贞贞 《现代图书情报技术》 CSSCI 2016年第9期88-94,共7页
【目的】实现年鉴指标数据的结构化存储,完成年鉴数据的更新录入。【应用背景】年鉴预处理平台是将年鉴数据统一整理、审核、上传的C/S工具平台,采用VC++为主要编程语言,为年鉴数据库建设提供数据基础。【方法】双向模式匹配处理是在WM... 【目的】实现年鉴指标数据的结构化存储,完成年鉴数据的更新录入。【应用背景】年鉴预处理平台是将年鉴数据统一整理、审核、上传的C/S工具平台,采用VC++为主要编程语言,为年鉴数据库建设提供数据基础。【方法】双向模式匹配处理是在WM模式算法基础上进行改进,利用分词技术对录入指标进行信息元提取、采用存储过程实现模式集合的筛减、信息双向匹配保证匹配的准确高效。【结果】通过对实验数据录入的匹配结果进行分析,发现双向模式匹配有较高指标匹配率和正确率。【结论】双向匹配算法能满足年鉴录入的需求,提高了年鉴数据预处理工作的效率。 展开更多
关键词 双向模式匹配 年鉴数据 wm算法
原文传递
基于贝叶斯及多模式串模糊匹配算法的不良短信甄别混合模型 被引量:2
19
作者 张文波 蒋春华 姚天昉 《微型电脑应用》 2012年第2期31-34,70,共4页
手机短信业务一方面给人们带来诸多便利,另一方面不法分子利用短信进行违法犯罪活动也日益猖狂,如何防范和打击此类犯罪活动对执法机关来说是一个新的挑战。提出了一个基于贝叶斯分类算法和改进的多模式串模糊匹配算法的不良短信甄别混... 手机短信业务一方面给人们带来诸多便利,另一方面不法分子利用短信进行违法犯罪活动也日益猖狂,如何防范和打击此类犯罪活动对执法机关来说是一个新的挑战。提出了一个基于贝叶斯分类算法和改进的多模式串模糊匹配算法的不良短信甄别混合模型,以实现对不良短信的识别和分类。短信经由朴素贝叶斯分类器进行是否不良的判断,对确认为不良的短信再经过多模式串的模糊匹配进行不良类别的分类。实验表明该方法提高了不良短信识别的准确率,具有良好的应用前景和实际效益。重点分析不良短信识别和分类过程。 展开更多
关键词 不良短信 朴素贝叶斯 多关键词匹配 wm算法
在线阅读 下载PDF
基于多模式匹配算法的供应商搜索系统
20
作者 田帆 范晶 《计算机工程》 CAS CSCD 北大核心 2009年第6期277-279,共3页
为满足外贸企业在互联网上搜索供应商的现实需求,在WM算法的基础上,引入压缩编码的思想,提出一种多模式中文信息匹配算法,实现相应的搜索系统。在测试与实际使用中,该系统表现出良好的性能,适用于含大量短关键词的实时数据流环境下的搜索。
关键词 压缩编码 wm算法 多模式匹配 数据流 供应商搜索
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部