期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
基于GAN的活跃IPv6地址生成算法
1
作者 王轶骏 杨林波 +1 位作者 赵瑞杰 薛质 《计算机应用与软件》 北大核心 2025年第8期167-172,共6页
针对IPv6地址空间巨大无法实施遍历扫描的问题,提出基于生成对抗网络的活跃IPv6地址生成算法。算法首先利用前缀树结构去除别名地址,减少别名地址对训练过程的影响,提高了命中地址的质量。其次使用生成对抗网络来学习种子地址集合的概... 针对IPv6地址空间巨大无法实施遍历扫描的问题,提出基于生成对抗网络的活跃IPv6地址生成算法。算法首先利用前缀树结构去除别名地址,减少别名地址对训练过程的影响,提高了命中地址的质量。其次使用生成对抗网络来学习种子地址集合的概率分布特征,以提高生成地址的命中率。实验表明,算法生成地址的质量和命中率上比现有算法均有所提升。 展开更多
关键词 互联网扫描 互联网协议第6版 生成对抗网络 谱归一化 前缀树
在线阅读 下载PDF
基于局部前缀树的差分隐私关联规则挖掘
2
作者 杨荣 荀亚玲 《太原科技大学学报》 2025年第4期307-313,共7页
传统基于差分隐私的关联规则挖掘多采用水平数据格式,同时以频繁项集生成为中心进行差分隐私保护,忽视了中低支持度的规则,且无法有效平衡隐私保护与数据可用性。对此,采用垂直数据格式和局部前缀树,提出一种可以快速挖掘中低支持度规... 传统基于差分隐私的关联规则挖掘多采用水平数据格式,同时以频繁项集生成为中心进行差分隐私保护,忽视了中低支持度的规则,且无法有效平衡隐私保护与数据可用性。对此,采用垂直数据格式和局部前缀树,提出一种可以快速挖掘中低支持度规则的差分隐私关联规则算法。该算法首先使用事务长度约束策略降低敏感度,减少项头表顺序信息的丢失;其次转换数据为垂直格式,并使用基于窗口的局部前缀树进行候选规则搜索,有效缩减了规则搜索空间并降低支持度重复计算;之后使用重新定义的质量函数,结合加权蓄水池进行指数机制抽样,对高质量规则进行分区提取;最后,经过理论分析及实验评价,验证了该算法的有效性及其效率。 展开更多
关键词 差分隐私 关联规则 局部前缀树 指数机制
在线阅读 下载PDF
前缀树的改进及其应用
3
作者 余志淼 《江苏通信》 2025年第2期52-56,共5页
前缀树,又称单词查找树或键树,是一种树形的数据结构。前缀树的典型应用是统计和排序,因此它经常运用于搜索引擎的词频统计。它的特点是利用单词的前缀来减少查询时间,最大限度地减少完整的字符串比较。本文旨在阐述对前缀树的改进以及... 前缀树,又称单词查找树或键树,是一种树形的数据结构。前缀树的典型应用是统计和排序,因此它经常运用于搜索引擎的词频统计。它的特点是利用单词的前缀来减少查询时间,最大限度地减少完整的字符串比较。本文旨在阐述对前缀树的改进以及改进后的前缀树在多种业务场景中数据快速统计的应用。 展开更多
关键词 前缀树 数据统计 排序
在线阅读 下载PDF
差分隐私下的一种频繁序列模式挖掘方法 被引量:7
4
作者 卢国庆 张啸剑 +2 位作者 丁丽萍 李彦峰 廖鑫 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2789-2801,共13页
频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私... 频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私保护的目的.由于序列数据内在序列性和高维度的特点,给差分隐私应用于频繁序列模式挖掘带来了挑战.对此提出了一种基于交互式差分隐私保护框架的频繁序列模式挖掘算法Diff-FSPM(differential-privacy frequent sequential pattern mining).该算法利用指数机制获取最优序列长度,并采用一种维规约策略获得原始序列数据集的规约表示,有效降低序列维度的影响;应用前缀树压缩频繁序列模式,利用拉普拉斯机制产生的噪音扰动频繁模式的真实支持度计数,同时采用闭频繁序列模式和Markov假设,有效分配隐私预算,并利用一致性约束后置处理,增强输出模式的可用性.理论角度证明算法满足ε-差分隐私,实验结果验证算法具有较好的可用性. 展开更多
关键词 频繁序列模式 数据挖掘 差分隐私 隐私保护 前缀树
在线阅读 下载PDF
一种基于前缀树的频繁模式挖掘算法 被引量:4
5
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选项集 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 新算法 中节点 递归
在线阅读 下载PDF
无重复投影数据库扫描的序列模式挖掘算法 被引量:17
6
作者 张坤 朱扬勇 《计算机研究与发展》 EI CSCD 北大核心 2007年第1期126-132,共7页
序列模式挖掘在Web点击流分析、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用.基于频繁模式增长的PrefixSpan是目前性能最好的序列模式挖掘算法之一.然而在密数据集和长序列模式挖掘过程中会出现大量的重复投影数据库,使... 序列模式挖掘在Web点击流分析、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用.基于频繁模式增长的PrefixSpan是目前性能最好的序列模式挖掘算法之一.然而在密数据集和长序列模式挖掘过程中会出现大量的重复投影数据库,使得这类算法性能下降.算法SPMDS通过对投影数据库的伪投影做单项杂凑函数,如MD5等,检查是否存在重复的投影数据库,避免大量重复数据库的扫描,并采用一些必要条件简化投影数据库的搜索,进而提高算法的性能.实验和分析都表明SPMDS性能优于PrefixSpan. 展开更多
关键词 序列模式挖掘 投影数据库 前缀树 单向杂凑函数
在线阅读 下载PDF
一种基于Hadoop的关联规则挖掘算法 被引量:8
7
作者 丁勇 朱长水 武玉艳 《计算机科学》 CSCD 北大核心 2018年第B11期409-411,416,共4页
传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算... 传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算节点定义一个前缀共享树,通过递归调用的方式将事务T生成的候选项集逐层压缩到前缀共享树(PST)中。然后广度遍历PST,逐层将每个节点对应的〈key,value〉作为map函数的输入,并由MapReduce框架自动按照key值进行聚集。最后调用reduce函数对多个任务的处理结果进行汇总,得到满足最小支持度阈值的频繁项集。算法只使用两个MapReduce任务,且PST按照key值排序便于Mapper端的shuffle操作,提高了运行效率。 展开更多
关键词 关联规则 HADOOP MAPREDUCE 前缀共享树
在线阅读 下载PDF
支持告警序列差分隐私保护的网络入侵关联方法 被引量:9
8
作者 李洪成 吴晓平 《计算机工程》 CAS CSCD 北大核心 2018年第5期128-132,共5页
在网络入侵情报协同分析过程中,告警数据的共享使被攻击者面临隐私泄露的风险。针对现有告警信息隐私保护方法无法应对背景知识下恶意分析的问题,提出一种新的网络告警关联分析方法。以原始告警序列数据集作为输入,利用Laplace机制构建... 在网络入侵情报协同分析过程中,告警数据的共享使被攻击者面临隐私泄露的风险。针对现有告警信息隐私保护方法无法应对背景知识下恶意分析的问题,提出一种新的网络告警关联分析方法。以原始告警序列数据集作为输入,利用Laplace机制构建支持差分隐私保护的噪声告警序列前缀树。在此基础上,通过遍历噪声前缀树生成泛化告警序列数据集,使用频繁序列挖掘算法实现告警关联。从理论角度证明该方法支持ε-差分隐私保护,并在典型多步攻击场景LLDoS1.0 inside数据集上进行验证。实验结果表明,该方法在保护告警序列隐私的同时,能够提高告警关联准确性。 展开更多
关键词 入侵检测 告警关联 差分隐私保护 频繁序列挖掘 前缀树
在线阅读 下载PDF
最大频繁模式的快速挖掘与更新算法 被引量:3
9
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第24期23-26,143,共5页
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文... 挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文章提出了一种最大频繁模式的快速挖掘算法DMFP及更新算法IUMFP。DMFP算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。算法IUMFP充分利用以前的挖掘结果减少发现更新数据中新的最大频繁模式的代价。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
在线阅读 下载PDF
分布环境中的并行频繁模式挖掘算法 被引量:3
10
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第25期1-3,22,共4页
频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP-tree。由于两者的固有局限性,而且在计算过程中需要多次同步,因而具有较低的性能。文章提出了一种基于分布数据库的并行挖掘算法... 频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP-tree。由于两者的固有局限性,而且在计算过程中需要多次同步,因而具有较低的性能。文章提出了一种基于分布数据库的并行挖掘算法。该算法尽可能地让每个处理器独立地挖掘,每个处理器基于前缀树采用深度优先搜索的策略挖掘局部频繁模式集,并通过相关性质尽量减少候选全局频繁模式的规模,减少网络的通信量和同步次数以提高挖掘效率。 展开更多
关键词 频繁模式 并行算法 前缀树 全局频繁模式
在线阅读 下载PDF
改进的树型结构RFID防碰撞算法 被引量:20
11
作者 王雪 钱志鸿 +1 位作者 刘晓慧 程超 《通信学报》 EI CSCD 北大核心 2015年第7期129-137,共9页
将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方... 将整棵大查询树分为若干分支,在每一个分支内进行标签识别,减少碰撞发生的概率。算法分为前缀确定和分支查询2个阶段,在前缀确定阶段读取所有标签前缀,每个前缀代表一个分支,依次遍历每一分支;查询过程采用后退式搜索策略和动态搜索方式。理论分析和仿真实验表明,算法能够从查询次数、时延、吞吐率多方面改善RFID系统的整体性能。 展开更多
关键词 RFID 防碰撞 树型结构 前缀查询 后退式搜索
在线阅读 下载PDF
基于交集为空的概念格批处理生成算法 被引量:2
12
作者 董辉 马垣 +2 位作者 沈文轩 宫玺 汤新明 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期32-35,共4页
采用剪枝方法,通过对NextClosure算法的改进,提出一种基于剪枝的概念格批处理算法Prun-NextClosure,减少了概念格构造过程中闭包运算的次数,从而提高概念格的构造效率。实验使用随机生成的数据集,验证了该算法的正确性和有效性。
关键词 概念格 批处理算法 前缀树
在线阅读 下载PDF
RFID系统中改进的混合查询树防碰撞算法 被引量:6
13
作者 南敬昌 单晓艳 高明明 《计算机工程》 CAS CSCD 2012年第23期291-292,F0003,共3页
针对无线射频识别(RFID)技术系统中的标签碰撞问题,采用混合查询树与多叉树结合的方法,提出一种改进的混合查询树防碰撞算法。在QT算法的基础上,通过标签序列生成器判断标签碰撞信息,结合八叉树询问机制,避免空闲周期和延迟时隙产生,减... 针对无线射频识别(RFID)技术系统中的标签碰撞问题,采用混合查询树与多叉树结合的方法,提出一种改进的混合查询树防碰撞算法。在QT算法的基础上,通过标签序列生成器判断标签碰撞信息,结合八叉树询问机制,避免空闲周期和延迟时隙产生,减少碰撞以及标签冲突和系统开销。实验结果证明,该算法优于QT、HQT算法,可减少查询次数和系统通信量,改进的混合查询树算法的识别效率较HQT算法提高46.1%。 展开更多
关键词 无线射频识别 标签 查询树 匹配前缀 八叉树 防碰撞
在线阅读 下载PDF
基于前缀树的高效频繁项集挖掘算法 被引量:6
14
作者 才科扎西 黄景廉 《计算机工程》 CAS CSCD 北大核心 2010年第4期42-44,共3页
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引编号,保证前缀树中事务顺序的一致性,根据索引编号等信息创建紧凑的前缀树,采用自底向上的挖掘与投影... 针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引编号,保证前缀树中事务顺序的一致性,根据索引编号等信息创建紧凑的前缀树,采用自底向上的挖掘与投影的方式挖掘出频繁项集。实验结果表明,该算法挖掘效率高、占用空间少。 展开更多
关键词 频繁项集 数据挖掘 前缀树
在线阅读 下载PDF
一种最大频繁模式的快速挖掘算法 被引量:3
15
作者 王运鹏 胡修林 阮幼林 《计算机应用研究》 CSCD 北大核心 2006年第10期86-88,共3页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
在线阅读 下载PDF
一种基于前缀树的增量序列挖掘算法 被引量:2
16
作者 张坤 陈越 朱扬勇 《计算机工程》 CAS CSCD 北大核心 2007年第19期69-71,共3页
在已有模式的基础上,该文挖掘出了新的模式,减少了挖掘原始数据库次数,指出了IncSpan+算法存在的问题,说明了基于半频繁模式的增量挖掘算法的缺陷,提出了一种增量序列模式挖掘算法。该算法构造了前缀树表示序列模式,并用广度剪枝和深度... 在已有模式的基础上,该文挖掘出了新的模式,减少了挖掘原始数据库次数,指出了IncSpan+算法存在的问题,说明了基于半频繁模式的增量挖掘算法的缺陷,提出了一种增量序列模式挖掘算法。该算法构造了前缀树表示序列模式,并用广度剪枝和深度剪枝维护该前缀树的结构。实验表明,该算法具有良好的性能。 展开更多
关键词 增量序列模式挖掘 广度剪枝 深度剪枝 前缀树
在线阅读 下载PDF
基于树型结构和加权熵的中文高频词提取算法 被引量:1
17
作者 王龙 刘衍珩 +1 位作者 李晓光 官健 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第1期188-192,共5页
提出了一种基于树型结构和加权熵的中文高频词提取算法。简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述。实验结果表明,该算法是可行和有效的。
关键词 计算机应用 中文高频词 提取算法 加权熵 前缀树 后缀树
在线阅读 下载PDF
大数据环境下基于前缀树的频繁项集挖掘 被引量:2
18
作者 黄彩娟 刘卓华 +1 位作者 所辉 杨滨 《控制工程》 CSCD 北大核心 2019年第11期2136-2140,共5页
针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修... 针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显著地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。 展开更多
关键词 频繁项集挖掘 MAPREDUCE 前缀序列树 模糊支持度 大数据
原文传递
一种基于哈希表和Trie树的快速IP路由查找算法 被引量:7
19
作者 崔尚森 张白一 《计算机工程与应用》 CSCD 北大核心 2005年第9期156-158,共3页
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。... Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。算法综合考虑了IP地址的分布特点,兼顾了查找速度、存储空间利用、硬件实现,以及向IPv6过渡等几个因素。具有算法简单、查找速度较快、存储空间利用率较高、易于扩展和便于硬件实现等特点。 展开更多
关键词 路由查找 最长前缀匹配 哈希 TRIE树
在线阅读 下载PDF
一种基于前缀编码的树生成算法 被引量:1
20
作者 况立群 熊风光 韩燮 《小型微型计算机系统》 CSCD 北大核心 2010年第5期849-852,共4页
为了使树生成算法更为通用且效率更高,提出一种基于前缀编码的树生成算法.算法中的节点采用前缀编码的数据结构,便于用户对树中节点及其下层子节点上的关联数据进行快速查询和统计.由于在构造树之前已采用先根遍历的方式对节点进行了排... 为了使树生成算法更为通用且效率更高,提出一种基于前缀编码的树生成算法.算法中的节点采用前缀编码的数据结构,便于用户对树中节点及其下层子节点上的关联数据进行快速查询和统计.由于在构造树之前已采用先根遍历的方式对节点进行了排序,同时建树过程中记录了最近各层节点的信息,因此无需搜索节点的上下层信息就可直接建立起树,大幅提高了建树效率,算法时间复杂度为O(n).该算法无需额外的数据预处理即可构造任意子树,且不会增加算法复杂度. 展开更多
关键词 前缀树 递归树 树生成算法 前序遍历
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部