期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多级字典存储的未知文本协议候选关键词链式合并方法
1
作者 陈庆超 王韬 +1 位作者 尹世庄 冯文博 《计算机科学》 CSCD 北大核心 2020年第12期332-335,共4页
关键词提取是进行未知网络协议逆向的关键步骤。鉴于现有的关键词提取方法存在精确度不高、需要较多先验知识、操作繁琐等问题,提出了一种基于位置信息的关键词自动化提取算法。首先,通过Trigram分词获取候选关键词,附加上位置信息后,... 关键词提取是进行未知网络协议逆向的关键步骤。鉴于现有的关键词提取方法存在精确度不高、需要较多先验知识、操作繁琐等问题,提出了一种基于位置信息的关键词自动化提取算法。首先,通过Trigram分词获取候选关键词,附加上位置信息后,将其组织成多级字典;在此基础上,根据位置信息将传统的对候选关键词进行树状合并改进为对其进行链式合并,以获得更精确的最长候选关键词。实验结果表明,当设置频繁度阈值为0.6时,该方法即可以准确提取出文本协议的关键词。同时,分析了频繁度的设置对实验效果的影响,并讨论了基于频繁序列对关键词进行挖掘的相关算法的局限性。 展开更多
关键词 位置信息 关键词提取 未知文本协议 Trigram 链式 多级字典
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部