期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
Framework to Model User Request Access Patterns in the World Wide Web
1
作者 Richard Hurley Robert Sturgeon 《Journal of Software Engineering and Applications》 2024年第2期69-88,共20页
In this paper, we present a novel approach to model user request patterns in the World Wide Web. Instead of focusing on the user traffic for web pages, we capture the user interaction at the object level of the web pa... In this paper, we present a novel approach to model user request patterns in the World Wide Web. Instead of focusing on the user traffic for web pages, we capture the user interaction at the object level of the web pages. Our framework model consists of three sub-models: one for user file access, one for web pages, and one for storage servers. Web pages are assumed to consist of different types and sizes of objects, which are characterized using several categories: articles, media, and mosaics. The model is implemented with a discrete event simulation and then used to investigate the performance of our system over a variety of parameters in our model. Our performance measure of choice is mean response time and by varying the composition of web pages through our categories, we find that our framework model is able to capture a wide range of conditions that serve as a basis for generating a variety of user request patterns. In addition, we are able to establish a set of parameters that can be used as base cases. One of the goals of this research is for the framework model to be general enough that the parameters can be varied such that it can serve as input for investigating other distributed applications that require the generation of user request access patterns. 展开更多
关键词 Performance Modelling World Wide web SIMULATION User Request access patterns FRAMEWORK
在线阅读 下载PDF
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
2
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 web使用挖掘 最大频繁访问模式 有向树 web日志
在线阅读 下载PDF
基于Web日志的用户访问模式挖掘 被引量:15
3
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
在线阅读 下载PDF
一种从Web日志中挖掘访问模式的新算法 被引量:7
4
作者 肖国强 肖轶 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第5期70-72,共3页
提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后... 提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后对算法的性能进行了分析并给出试验数据加以佐证 .这个算法的特点是不需要产生候选模式而直接挖掘出所有的访问模式 . 展开更多
关键词 web访问模式 web日志 WSA树
在线阅读 下载PDF
一种分布式Web使用模式挖掘模型及算法 被引量:2
5
作者 张克君 杨炳儒 +2 位作者 赵耿 曲文龙 李欣 《北京科技大学学报》 EI CAS CSCD 北大核心 2006年第9期896-901,共6页
给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分... 给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性. 展开更多
关键词 分布式数据挖掘 web使用模式挖掘 web日志挖掘 频繁路径
在线阅读 下载PDF
基于过滤器的Web访问模式挖掘 被引量:2
6
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第6期59-61,共3页
针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算... 针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。 展开更多
关键词 数据挖掘 web日志 访问模式 频集
在线阅读 下载PDF
一种基于粗糙集的Web用户访问规则获取方法 被引量:3
7
作者 张永 杨志勇 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期84-85,146,共3页
用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数... 用户浏览模式获取是现阶段Web日志挖掘的主要目标之一。该文根据用户浏览的重要特征,提出了一种应用粗糙集理论获取规则的方法。选取重要特征作为条件属性并通过算法实现获取最终规则,实例分析效果良好。该方法的特点是只需要简单的数据预处理但可以获得简洁有效的访问模式。 展开更多
关键词 web访问模式 粗糙集 数据挖掘
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
8
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 PREFIXSPAN算法 web日志挖掘
在线阅读 下载PDF
一种基于Web用户访问模式的矩阵聚类算法研究 被引量:2
9
作者 包剑 郭丽春 黄金波 《西华大学学报(自然科学版)》 CAS 2010年第4期85-87,共3页
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的... 针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。 展开更多
关键词 web挖掘 用户访问模式 web内容挖掘 矩阵聚类
在线阅读 下载PDF
一种新的Web频繁访问模式挖掘算法 被引量:4
10
作者 章志明 余敏 黄明和 《微计算机信息》 北大核心 2007年第18期184-186,共3页
提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即... 提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即可直接挖掘出所有的Web频繁访问路径,大大提高了Web访问模式的发现效率。 展开更多
关键词 web挖掘 访问模式 频繁访问模式
在线阅读 下载PDF
基于双Kohonen神经网络的Web用户访问模式挖掘算法 被引量:4
11
作者 段隆振 朱敏 王靓明 《计算机工程与科学》 CSCD 北大核心 2009年第9期95-98,共4页
本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网... 本文根据Kohonen自组织特征映射神经网络中学习阶段的性质,运用双Kohonen神经网络组合成新的自组织训练挖掘模型,先使用粗调整训练,加快模型学习速度,紧接着使用微调整训练,提高模型学习精度。实验结果表明,本文提出的双Kohonen神经网络挖掘模型,相对于标准Kohonen神经网络在训练速度和收敛效果上都有一定程度的提高,改善了聚类效果,为挖掘用户的多种兴趣提供了一种可行的方法。 展开更多
关键词 web数据挖掘 用户访问模式 KOHONEN神经网络 学习率 邻域
在线阅读 下载PDF
一种新的Web用户群体和URL聚类算法的研究 被引量:11
12
作者 宋江春 沈钧毅 《控制与决策》 EI CSCD 北大核心 2007年第3期284-288,共5页
提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问... 提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究. 展开更多
关键词 web使用挖掘 用户浏览模式 用户访问矩阵 用户事务聚类 站点URL聚类
在线阅读 下载PDF
基于兴趣度的Web用户聚类方法 被引量:1
13
作者 袁冠 夏士雄 +2 位作者 张磊 李月娥 肖经验 《微电子学与计算机》 CSCD 北大核心 2008年第9期112-114,共3页
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过... 现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果. 展开更多
关键词 web挖掘 web聚类 兴趣度 访问模式 遗忘机制
在线阅读 下载PDF
Web使用挖掘中Apriori算法的改进研究 被引量:6
14
作者 许晓东 李柯 朱士瑞 《计算机工程与设计》 CSCD 北大核心 2010年第3期539-541,563,共4页
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项... 分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项集的个数。并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率。试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式。 展开更多
关键词 web挖掘 不规则数组 项集有序性 二进制 访问模式
在线阅读 下载PDF
基于模糊粗糙近似的web浏览模式的聚类 被引量:3
15
作者 吴瑞 宁玉富 郭长友 《系统工程学报》 CSCD 北大核心 2010年第1期132-136,144,共6页
提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户... 提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类. 展开更多
关键词 web聚类 模糊变量 粗糙变量 用户浏览模式
在线阅读 下载PDF
基于区域特征分布式Web用户兴趣迁移模式
16
作者 张克君 杨炳儒 +2 位作者 章小莉 宋泽锋 陈卓 《系统工程与电子技术》 EI CSCD 北大核心 2008年第10期1995-1998,共4页
提出一种基于区域特征的分布式Web用户兴趣迁移模式挖掘模型DWICP,以及基于该模型的具有区域特征的用户识别方法和局部浏览兴趣迁移模式更新算法/全局浏览兴趣迁移模式更新算法,用于发现具有区域特征的用户浏览兴趣迁移模式。实验表明,... 提出一种基于区域特征的分布式Web用户兴趣迁移模式挖掘模型DWICP,以及基于该模型的具有区域特征的用户识别方法和局部浏览兴趣迁移模式更新算法/全局浏览兴趣迁移模式更新算法,用于发现具有区域特征的用户浏览兴趣迁移模式。实验表明,该方法能够较好地解决分布式环境下Web访问行为模式研究中的区域分析需求,同时提高了用户浏览兴趣表示的准确性。 展开更多
关键词 分布式数据挖掘 兴趣迁移模式 web访问模式挖掘 区域特征
在线阅读 下载PDF
基于最大正向引用序列的Web浏览模式挖掘算法与应用 被引量:1
17
作者 孙金华 朱顺痣 +1 位作者 翁伟 谢彦麒 《黄石理工学院学报》 2010年第5期28-32,共5页
Web日志中包含了大量用户浏览信息,如何有效地从中挖掘出用户浏览兴趣模式是一个重要的研究课题。文章研究如何从Web日志中发现用户网页浏览模式,具体阐述如何构造最大正向引用序列,在此基础上,设计一个挖掘算法来发现用户的网页浏览模... Web日志中包含了大量用户浏览信息,如何有效地从中挖掘出用户浏览兴趣模式是一个重要的研究课题。文章研究如何从Web日志中发现用户网页浏览模式,具体阐述如何构造最大正向引用序列,在此基础上,设计一个挖掘算法来发现用户的网页浏览模式,称之为FLRS算法。实验证明该算法是有效的,执行时间性能优于传统的FS算法。 展开更多
关键词 web挖掘 最大正向引用序列 网页浏览模式
在线阅读 下载PDF
改进的基于Web的频繁访问路径挖掘算法 被引量:1
18
作者 庞敏 赵乙国 周海英 《测试技术学报》 2009年第3期244-247,共4页
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法,挖掘效率是比较低的,而且只能得到频繁访问路径.本文在研究访问路径性质的基础上给出了一种能从普通Web日志中挖掘出连续频繁访问路径的算法.设计了一种新颖的数据结构压缩... 对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法,挖掘效率是比较低的,而且只能得到频繁访问路径.本文在研究访问路径性质的基础上给出了一种能从普通Web日志中挖掘出连续频繁访问路径的算法.设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息.同时采用分区搜索的方式,为每个频繁节点构造一棵后缀树,通过遍历该后缀树挖掘出连续频繁访问路径.采用这种方法进行挖掘,无需生成候选集,而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径. 展开更多
关键词 连续频繁访问路径 网络服务器日志 分区搜索 后缀树 频繁节点
在线阅读 下载PDF
面向Web活跃用户的树型访问模式挖掘算法
19
作者 贝毅君 陈刚 董金祥 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期1005-1013,1140,共10页
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web... 传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAP-BUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析. 展开更多
关键词 web使用挖掘 web访问模式 web日志 活跃用户 频繁子树
在线阅读 下载PDF
基于Web挖掘的远程教育课件访问模式分析系统 被引量:2
20
作者 赵宝华 《计算机应用与软件》 CSCD 2009年第3期149-152,共4页
课件访问模式分析系统利用Web使用挖掘技术对服务器日志进行挖掘,通过对用户浏览课件的学习行为进行分析从而为课件制作的优化、教学监控的实施以及教学管理等提供决策依据。提出的系统是对现存相关产品的完善和有益的补充。
关键词 web使用挖掘 远程教育 访问模式
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部