-
题名多级字典存储的未知文本协议候选关键词链式合并方法
- 1
-
-
作者
陈庆超
王韬
尹世庄
冯文博
-
机构
陆军工程大学装备模拟训练中心
陆军工程大学指挥控制工程学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第12期332-335,共4页
-
基金
国家重点研发计划(2017YFB0802900)
江苏省自然科学基金(BK20161469)。
-
文摘
关键词提取是进行未知网络协议逆向的关键步骤。鉴于现有的关键词提取方法存在精确度不高、需要较多先验知识、操作繁琐等问题,提出了一种基于位置信息的关键词自动化提取算法。首先,通过Trigram分词获取候选关键词,附加上位置信息后,将其组织成多级字典;在此基础上,根据位置信息将传统的对候选关键词进行树状合并改进为对其进行链式合并,以获得更精确的最长候选关键词。实验结果表明,当设置频繁度阈值为0.6时,该方法即可以准确提取出文本协议的关键词。同时,分析了频繁度的设置对实验效果的影响,并讨论了基于频繁序列对关键词进行挖掘的相关算法的局限性。
-
关键词
位置信息
关键词提取
未知文本协议
Trigram
链式
多级字典
-
Keywords
Location information
Keyword extraction
unknown text protocol
Trigram
Chain
Multi-level dictionary
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-