期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
An Efficient Hybrid Algorithm for Mining Web Frequent Access Patterns 被引量:1
1
作者 ZHANLi-qiang LIUDa-xin 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期557-560,共4页
We propose an efficient hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP to optimize its performance, which is using hash table to filter candidate set and tri... We propose an efficient hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP to optimize its performance, which is using hash table to filter candidate set and trimming database. Whenever the database is trimmed to a size less than a specified threshold, the algorithm puts the database into main memory by constructing a tree, and finds frequent patterns on the tree. The experiment shows that WDHP outperform algorithm DHP and main memory based algorithm WAP in execution efficiency. 展开更多
关键词 frequent access pattern AP-tree hash-table
在线阅读 下载PDF
Framework to Model User Request Access Patterns in the World Wide Web
2
作者 Richard Hurley Robert Sturgeon 《Journal of Software Engineering and Applications》 2024年第2期69-88,共20页
In this paper, we present a novel approach to model user request patterns in the World Wide Web. Instead of focusing on the user traffic for web pages, we capture the user interaction at the object level of the web pa... In this paper, we present a novel approach to model user request patterns in the World Wide Web. Instead of focusing on the user traffic for web pages, we capture the user interaction at the object level of the web pages. Our framework model consists of three sub-models: one for user file access, one for web pages, and one for storage servers. Web pages are assumed to consist of different types and sizes of objects, which are characterized using several categories: articles, media, and mosaics. The model is implemented with a discrete event simulation and then used to investigate the performance of our system over a variety of parameters in our model. Our performance measure of choice is mean response time and by varying the composition of web pages through our categories, we find that our framework model is able to capture a wide range of conditions that serve as a basis for generating a variety of user request patterns. In addition, we are able to establish a set of parameters that can be used as base cases. One of the goals of this research is for the framework model to be general enough that the parameters can be varied such that it can serve as input for investigating other distributed applications that require the generation of user request access patterns. 展开更多
关键词 Performance Modelling World Wide web SIMULATION User Request access patterns FRAMEWORK
在线阅读 下载PDF
A Novel Incremental Mining Algorithm of Frequent Patterns for Web Usage Mining 被引量:1
3
作者 DONG Yihong ZHUANG Yueting TAI Xiaoying 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期777-782,共6页
Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a... Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by "pruning and laying back" to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision. 展开更多
关键词 incremental algorithm association rule frequent pattern tree web usage mining
在线阅读 下载PDF
Mining Cross-Transaction Web Usage Patterns
4
作者 Jian Chen Jian Yin Jin Huang Liangyi Ou 《通讯和计算机(中英文版)》 2005年第5期6-11,81,共7页
关键词 web系统 存贮器 交叉处理器 计算机技术
在线阅读 下载PDF
高效的WEB-Log Mining算法
5
作者 马涛 刘昱琨 王希雷 《微机发展》 2003年第4期71-72,75,共3页
通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径。这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类... 通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径。这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类,最终得到了满意的聚类结果。最后,给出了一个应用实例,实例表明,该方法是有效可行的。 展开更多
关键词 web-Log mining算法 数据库 数据挖掘 会话 客户群体聚类 频繁访问路径
在线阅读 下载PDF
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
6
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 web使用挖掘 最大频繁访问模式 有向树 web日志
在线阅读 下载PDF
基于Web日志的用户访问模式挖掘 被引量:15
7
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
在线阅读 下载PDF
Web日志的高效多能挖掘算法 被引量:115
8
作者 宋擒豹 沈钧毅 《计算机研究与发展》 EI CSCD 北大核心 2001年第3期328-333,共6页
通过对 Web服务器日志文件和客户交易数据进行分析 ,可以发现相似客户群体、相关 Web页面和频繁访问路径 .提出了一种新颖的 Web日志挖掘算法 .在该算法中 ,首先以 Web站点 URL 为行、以 User ID为列建立URL- User ID关联矩阵 ,元素值... 通过对 Web服务器日志文件和客户交易数据进行分析 ,可以发现相似客户群体、相关 Web页面和频繁访问路径 .提出了一种新颖的 Web日志挖掘算法 .在该算法中 ,首先以 Web站点 URL 为行、以 User ID为列建立URL- User ID关联矩阵 ,元素值为用户的访问次数 ,然后 ,对列向量进行相似性分析得到相似客户群体 ,对行向量进行相似性度量获得相关 Web页面 ,对后者再进一步处理还可以发现频繁访问路径 . 展开更多
关键词 电子商务 web 日志挖掘 INTERNET 数据挖掘 算法
在线阅读 下载PDF
Web使用挖掘中Apriori算法的改进研究 被引量:6
9
作者 许晓东 李柯 朱士瑞 《计算机工程与设计》 CSCD 北大核心 2010年第3期539-541,563,共4页
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项... 分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项集的个数。并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率。试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式。 展开更多
关键词 web挖掘 不规则数组 项集有序性 二进制 访问模式
在线阅读 下载PDF
一种分布式Web使用模式挖掘模型及算法 被引量:2
10
作者 张克君 杨炳儒 +2 位作者 赵耿 曲文龙 李欣 《北京科技大学学报》 EI CAS CSCD 北大核心 2006年第9期896-901,共6页
给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分... 给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性. 展开更多
关键词 分布式数据挖掘 web使用模式挖掘 web日志挖掘 频繁路径
在线阅读 下载PDF
基于过滤器的Web访问模式挖掘 被引量:2
11
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第6期59-61,共3页
针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算... 针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。 展开更多
关键词 数据挖掘 web日志 访问模式 频集
在线阅读 下载PDF
一种新的Web用户群体和URL聚类算法的研究 被引量:11
12
作者 宋江春 沈钧毅 《控制与决策》 EI CSCD 北大核心 2007年第3期284-288,共5页
提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问... 提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究. 展开更多
关键词 web使用挖掘 用户浏览模式 用户访问矩阵 用户事务聚类 站点URL聚类
在线阅读 下载PDF
统一权限管理下的Web应用管理平台 被引量:4
13
作者 靳大尉 赵成 陈刚 《计算机应用》 CSCD 北大核心 2013年第A02期305-306,311,共3页
提出并实现了一种可管理多个Web应用、多级、细粒度的权限管理平台。对NIST RBAC进行了扩展,增加了客体层次关系、基于规则的角色指派和硬件绑定约束。应用JavaEE、Eclipse RCP、设计模式等多种方法和技术完成系统实现。实践证明,系统... 提出并实现了一种可管理多个Web应用、多级、细粒度的权限管理平台。对NIST RBAC进行了扩展,增加了客体层次关系、基于规则的角色指派和硬件绑定约束。应用JavaEE、Eclipse RCP、设计模式等多种方法和技术完成系统实现。实践证明,系统具有良好的实用性和可扩展性。 展开更多
关键词 web应用 基于角色的访问控制 身份认证 访问控制 设计模式
在线阅读 下载PDF
Web日志中时态约束浏览模式挖掘算法研究 被引量:3
14
作者 宁慧 李红宇 吴培莲 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第9期1474-1480,共7页
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事... 为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值. 展开更多
关键词 web日志挖掘 频繁访问模式 有效时间
在线阅读 下载PDF
一种从Web日志中挖掘访问模式的新算法 被引量:7
15
作者 肖国强 肖轶 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第5期70-72,共3页
提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后... 提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后对算法的性能进行了分析并给出试验数据加以佐证 .这个算法的特点是不需要产生候选模式而直接挖掘出所有的访问模式 . 展开更多
关键词 web访问模式 web日志 WSA树
在线阅读 下载PDF
基于双Kohonen神经网络的Web用户访问模式挖掘算法 被引量:4
16
作者 段隆振 朱敏 王靓明 《计算机工程与科学》 CSCD 北大核心 2009年第9期95-98,共4页
本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网... 本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网络挖掘模型,相对于标准Kohonen神经网络在训练速度和收敛效果上都有一定程度的提高,改善了聚类效果,为挖掘用户的多种兴趣提供了一种可行的方法。 展开更多
关键词 web数据挖掘 用户访问模式 KOHONEN神经网络 学习率 邻域
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
17
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 PREFIXSPAN算法 web日志挖掘
在线阅读 下载PDF
基于模糊粗糙近似的web浏览模式的聚类 被引量:3
18
作者 吴瑞 宁玉富 郭长友 《系统工程学报》 CSCD 北大核心 2010年第1期132-136,144,共6页
提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户... 提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类. 展开更多
关键词 web聚类 模糊变量 粗糙变量 用户浏览模式
在线阅读 下载PDF
一种新的Web频繁访问模式挖掘算法 被引量:4
19
作者 章志明 余敏 黄明和 《微计算机信息》 北大核心 2007年第18期184-186,共3页
提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即... 提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即可直接挖掘出所有的Web频繁访问路径,大大提高了Web访问模式的发现效率。 展开更多
关键词 web挖掘 访问模式 频繁访问模式
在线阅读 下载PDF
一种基于Web用户访问模式的矩阵聚类算法研究 被引量:2
20
作者 包剑 郭丽春 黄金波 《西华大学学报(自然科学版)》 CAS 2010年第4期85-87,共3页
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的... 针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。 展开更多
关键词 web挖掘 用户访问模式 web内容挖掘 矩阵聚类
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部