期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
A Novel Incremental Mining Algorithm of Frequent Patterns for Web Usage Mining 被引量:1
1
作者 DONG Yihong ZHUANG Yueting TAI Xiaoying 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期777-782,共6页
Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a... Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by "pruning and laying back" to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision. 展开更多
关键词 incremental algorithm association rule frequent pattern tree web usage mining
在线阅读 下载PDF
一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用 被引量:6
2
作者 姬浩博 王俊红 《计算机科学》 CSCD 北大核心 2016年第1期25-29,共5页
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接... 序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。 展开更多
关键词 序列模式挖掘 web日志挖掘 prefixspan算法
在线阅读 下载PDF
改进的PrefixSpan算法在Web挖掘中的应用 被引量:2
3
作者 谢清森 杨天奇 《科学技术与工程》 2009年第23期7176-7179,共4页
针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在... 针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。 展开更多
关键词 web挖掘 prefixspan算法 序列模式
在线阅读 下载PDF
一种基于日志分析的Web负载测试方法 被引量:8
4
作者 朱靖君 吴海燕 +1 位作者 高国柱 程志锐 《计算机工程》 CAS CSCD 北大核心 2010年第23期25-27,共3页
提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志... 提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志进行对比,验证了测试负载与真实负载的相似性。 展开更多
关键词 日志分析 负载测试 序列模式挖掘 prefixspan算法
在线阅读 下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
5
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 web日志挖掘 阈值 序列模式识别 IA^x算法
在线阅读 下载PDF
改进的PrefixSpan算法及其在序列模式挖掘中的应用 被引量:11
6
作者 张巍 刘峰 滕少华 《广东工业大学学报》 CAS 2013年第4期49-54,共6页
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法... 由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(Prefix of First Position on BitMap)表用于记录序列中的每个项在位图中第1次出现的位置.实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更好地挖掘出序列模式. 展开更多
关键词 序列模式 前缀投影序列模式挖掘 序列模式挖掘 位图 数据挖掘
在线阅读 下载PDF
基于改进的AprioriAll算法的Web序列模式挖掘研究 被引量:5
7
作者 吴海燕 朱靖君 +1 位作者 高国柱 程志锐 《计算机工程与设计》 CSCD 北大核心 2010年第5期921-924,1034,共5页
为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。... 为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。算法的改进主要有两点:一个通过改变候选序列的连接方式来减少候选序列的产生;二是通过减少不必要的数据库扫描操作来提高算法的效率。通过实验验证了改进后算法在Web序列模式挖掘过程中的高效性和正确性。 展开更多
关键词 AprioriAll算法 序列模式 web日志挖掘 事务 最大向前路径
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
8
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 prefixspan算法 web日志挖掘
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
9
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 web数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
GSP与PrefixSpan算法的比较与分析 被引量:4
10
作者 刘立军 崔杰 梅红岩 《辽宁工学院学报》 2006年第5期300-302,共3页
针对序列模式挖掘中的两种经典算法GSP算法与PrefixSpan算法执行过程及其特点进行了比较,并对这两种算法的时空执行效率进行了定性分析比较,指出了两种算法各自的适用范围,得出的结果对序列模式挖掘系统的设计有重要的参考价值。
关键词 序列模式挖掘 GSP算法 prefixspan算法
在线阅读 下载PDF
基于用户特性的Web会话模式聚类算法 被引量:2
11
作者 郑富兰 吴瑞 《计算机应用与软件》 CSCD 北大核心 2014年第2期283-286,共4页
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differ... Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。 展开更多
关键词 web挖掘 web用户聚类 聚类算法 模式聚类 K-MEANS
在线阅读 下载PDF
Web挖掘中基于GITC算法发现用户频繁访问模式 被引量:1
12
作者 欧阳一鸣 郭维 +1 位作者 郭骏 孙超超 《计算机工程与应用》 CSCD 北大核心 2007年第7期191-194,共4页
用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发... 用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发现用户频繁访问模式。 展开更多
关键词 web日志挖掘 类Apriori算法 交集关系 最大前向引用 频繁访问模式
在线阅读 下载PDF
视频目标轨迹分析的改进PrefixSpan方法 被引量:2
13
作者 袁和金 《计算机工程与应用》 CSCD 北大核心 2011年第32期7-10,58,共5页
从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用... 从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用改进的PrefixSpan算法挖掘其中连续出现的频繁模式,通过字符串近似匹配的方法来检测当前运动轨迹所表示的目标行为是否异常。由于不需要计算两两轨迹之间的相似性,该方法可以应用于规模较大、分布模式数目难以确定场合下的视频目标轨迹分析问题。对仿真和真实场景的实验验证了该方法的有效性。 展开更多
关键词 轨迹模式 序列模式挖掘 prefixspan算法
在线阅读 下载PDF
基于会话分类的Web用户访问模式挖掘研究
14
作者 吴海燕 朱靖君 +1 位作者 高国柱 程志锐 《小型微型计算机系统》 CSCD 北大核心 2010年第9期1784-1789,共6页
随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础... 随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础上分别对3类用户的访问模式进行挖掘.通过会话分类可以提高挖掘的效率与准确性.其中重点研究了人类用户的访问模式挖掘,提出一种基于用户访问路径树的事务识别方法,并对PrefixSpan算法进行了改进.这套方法在实验中取得了很好的挖掘效果. 展开更多
关键词 web挖掘 会话分类 访问模式 序列模式 prefixspan
在线阅读 下载PDF
用户Web日志序列模式挖掘研究 被引量:4
15
作者 李林 崔志明 《微机发展》 2005年第5期119-121,157,共4页
单个用户访问网站能够留下大量的访问信息,合理地挖掘这些信息便能够得到用户个人的访问模式。文中将序列模式挖掘运用到单一用户Web日志上,最终可以得到单一用户的访问序列模式。在序列模式挖掘过程中,将传统的序列模式挖掘概念进行了... 单个用户访问网站能够留下大量的访问信息,合理地挖掘这些信息便能够得到用户个人的访问模式。文中将序列模式挖掘运用到单一用户Web日志上,最终可以得到单一用户的访问序列模式。在序列模式挖掘过程中,将传统的序列模式挖掘概念进行了扩充,对应到单一用户的序列模式上;运用Session来划分时间段,增强了时间的概念;运用概念格的理论,很好地实现了增量序列模式挖掘。并使用一个新的算法,解决MFP(最大前向路径)在Web日志中获取存在的一些问题。 展开更多
关键词 序列模式 web日志挖掘 概念格 增量挖掘
在线阅读 下载PDF
Web日志挖掘中的用户访问模式识别 被引量:2
16
作者 刘沛骞 郭海儒 袁玲玲 《雁北师范学院学报》 2006年第2期23-25,共3页
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问... 本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度. 展开更多
关键词 web日志挖掘 访问序列 频繁访问模式
在线阅读 下载PDF
基于最大正向引用序列的Web浏览模式挖掘算法与应用 被引量:1
17
作者 孙金华 朱顺痣 +1 位作者 翁伟 谢彦麒 《黄石理工学院学报》 2010年第5期28-32,共5页
Web日志中包含了大量用户浏览信息,如何有效地从中挖掘出用户浏览兴趣模式是一个重要的研究课题。文章研究如何从Web日志中发现用户网页浏览模式,具体阐述如何构造最大正向引用序列,在此基础上,设计一个挖掘算法来发现用户的网页浏览模... Web日志中包含了大量用户浏览信息,如何有效地从中挖掘出用户浏览兴趣模式是一个重要的研究课题。文章研究如何从Web日志中发现用户网页浏览模式,具体阐述如何构造最大正向引用序列,在此基础上,设计一个挖掘算法来发现用户的网页浏览模式,称之为FLRS算法。实验证明该算法是有效的,执行时间性能优于传统的FS算法。 展开更多
关键词 web挖掘 最大正向引用序列 网页浏览模式
在线阅读 下载PDF
基于Markov链的Web访问序列挖掘算法研究及性能分析
18
作者 肖哲 任胜兵 《湖南工业大学学报》 2008年第3期53-56,共4页
引入正向、逆向Markov一步状态转移概率矩阵构造序列数据库,并将逐层投影的PrefixSpan序列挖掘算法改为伪投影和隔层投影算法结合,以改进经典序列算法中存在的时间或空间开销太大的缺陷。性能分析表明,与经典算法相比,这种基于Markov链... 引入正向、逆向Markov一步状态转移概率矩阵构造序列数据库,并将逐层投影的PrefixSpan序列挖掘算法改为伪投影和隔层投影算法结合,以改进经典序列算法中存在的时间或空间开销太大的缺陷。性能分析表明,与经典算法相比,这种基于Markov链的Web访问序列模式挖掘新算法能够通过较少的计算量和空间复杂度获得较优的W e b访问序列模式。 展开更多
关键词 数据挖掘 web访问 MARKOV链 序列模式
在线阅读 下载PDF
一种基于序列数的Web使用挖掘算法
19
作者 方刚 《计算机系统应用》 2010年第12期100-104,共5页
针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有... 针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有效地提高了Web使用挖掘的效率。实验表明其效率比现有算法更快速而有效。 展开更多
关键词 web使用挖掘 会话模式 web服务器日志 递增搜索 序列数
在线阅读 下载PDF
恶意代码检测中的PrefixSpan算法应用 被引量:3
20
作者 王丽娜 谭小彬 +1 位作者 潘剑锋 奚宏生 《计算机工程》 CAS CSCD 北大核心 2010年第7期119-121,共3页
结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码... 结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码行为序列库中挖掘关联规则,专家系统将获取的主机行为与规则匹配,从而达到检测恶意行为的目的。实验结果证明了该算法的正确性和有效性。 展开更多
关键词 恶意代码检测 基于行为检测 序列模式挖掘 prefixspan算法 投影数据库
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部