期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于Web-log的频繁浏览路径挖掘
1
作者 罗超 《信息技术》 2004年第11期4-7,共4页
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点... 利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。 展开更多
关键词 数据挖掘 网页日志挖掘 频繁浏览路径
在线阅读 下载PDF
一个简单的Web日志挖掘系统 被引量:22
2
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
WEB日志挖掘及其实现 被引量:13
3
作者 胡建武 何贞铭 张贻权 《计算机工程与应用》 CSCD 北大核心 2004年第14期156-158,共3页
Web日志中积累了大量的有用信息,从Web日志中发现有用的信息是非常必要的。该文研究了Web日志挖掘的机理,提出了通过访问路径挖掘来分析用户浏览模式的方法,并实现了一种有效的访问路径模式挖掘算法。
关键词 数据挖掘 web日志 访问路径模式
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
4
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
在线阅读 下载PDF
基于改进的AprioriAll算法的Web序列模式挖掘研究 被引量:5
5
作者 吴海燕 朱靖君 +1 位作者 高国柱 程志锐 《计算机工程与设计》 CSCD 北大核心 2010年第5期921-924,1034,共5页
为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。... 为了减少AprioriAll算法挖掘过程中候选序列的生成以及对序列数据库的扫描次数,提高算法的挖掘效率,提出了一种基于改进的AprioriAll算法的Web序列模式挖掘方法。首先对数据进行预处理,然后利用经过改进的AprioriAll算法进行模式挖掘。算法的改进主要有两点:一个通过改变候选序列的连接方式来减少候选序列的产生;二是通过减少不必要的数据库扫描操作来提高算法的效率。通过实验验证了改进后算法在Web序列模式挖掘过程中的高效性和正确性。 展开更多
关键词 AprioriAll算法 序列模式 web日志挖掘 事务 最大向前路径
在线阅读 下载PDF
关于提取Web用户浏览行为特征的研究 被引量:5
6
作者 胡亚慧 赵红军 +1 位作者 鲁汉榕 王海杰 《计算机工程与设计》 CSCD 北大核心 2006年第18期3416-3418,共3页
当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大... 当前,Web日志挖掘技术已成为实现网站个性化服务的研究热点。运用Markov模型来预测用户的浏览模式,从而提高站点访问率、为站点重组提供有利信息是该领域广泛采用的方法之一。但传统方法建立的Markov模型,存在着数据冗余复杂、模型庞大繁琐等问题。针对这些问题,介绍了一种改进的Markov模型。其方法主要是在原有模型的基础之上,在数据清洗、用户会话识别过程中删除一些不予考虑的因素,大大简化了建立的Markov模型,提高了Web日志挖掘的效率。 展开更多
关键词 web日志挖掘 浏览行为 MARKOV模型 数据清洗 会话识别
在线阅读 下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
7
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
在线阅读 下载PDF
一种分布式Web使用模式挖掘模型及算法 被引量:2
8
作者 张克君 杨炳儒 +2 位作者 赵耿 曲文龙 李欣 《北京科技大学学报》 EI CAS CSCD 北大核心 2006年第9期896-901,共6页
给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分... 给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性. 展开更多
关键词 分布式数据挖掘 web使用模式挖掘 web日志挖掘 频繁路径
在线阅读 下载PDF
Web日志与浏览行为结合下的用户浏览兴趣数据挖掘分析 被引量:9
9
作者 李珊 刘继超 邵芬红 《现代电子技术》 北大核心 2017年第5期22-25,共4页
针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特... 针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特征提取和Qo S预测;然后采用Web日志与用户浏览行为结合的行为调度模式自适应检索用户浏览网页的兴趣特征点,实现语义特征匹配,达到用户浏览兴趣模式数据挖掘的目的;最后通过仿真实验实现性能验证。结果表明,该方法的用户浏览兴趣特征点的匹配度高,数据挖掘精度得到提升,展示了优越性能。 展开更多
关键词 web日志 用户浏览行为 兴趣模式 数据挖掘
在线阅读 下载PDF
Web日志挖掘数据预处理研究 被引量:6
10
作者 何波 涂飞 程勇军 《微电子学与计算机》 CSCD 北大核心 2011年第4期111-114,共4页
数据预处理在Web日志挖掘过程中起着至关重要的作用.论文分析了Web日志挖掘数据预处理的主要步骤,设计了用户识别、访问操作识别和路径完善三个步骤的关键算法.实验结果表明,设计的关键算法是有效的.
关键词 数据预处理 web日志挖掘 路径完善 用户识别
在线阅读 下载PDF
基于社区Web日志挖掘的用户行为实证研究 被引量:5
11
作者 王仁武 袁毅 《图书馆论坛》 CSSCI 北大核心 2011年第4期100-102,共3页
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。
关键词 web 日志 web挖掘 用户行为 访问路径
在线阅读 下载PDF
Web日志挖掘的预处理及路径补全算法的研究 被引量:11
12
作者 王岚 翟正军 《微电子学与计算机》 CSCD 北大核心 2006年第8期113-116,共4页
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的... Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。 展开更多
关键词 web日志挖掘 数据预处理 路径补全 算法
在线阅读 下载PDF
基于过滤器的Web访问模式挖掘 被引量:2
13
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第6期59-61,共3页
针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算... 针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。 展开更多
关键词 数据挖掘 web日志 访问模式 频集
在线阅读 下载PDF
Web访问序列模式挖掘算法的研究 被引量:2
14
作者 李陶深 王伟娜 陈庆峰 《计算机科学》 CSCD 北大核心 2013年第12期41-44,共4页
针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户... 针对现有Web访问序列模式挖掘算法和PrefixSpan算法存在的问题,提出一种基于投影位置的Web访问序列模式挖掘算法(PWSPM)。该算法通过序列模式分析,发现用户的行为模式,预测用户对网页的访问模式,进而改进站点的性能和组织结构,提高用户查找信息的质量和效率,以及对用户开展个性化的信息服务。实验和应用结果表明,提出的算法具有更好的执行效率,适用于Web日志挖掘,可用于构建智能化Web站点和解决个性化的信息服务问题。 展开更多
关键词 web访问 序列模式 数据挖掘 PREFIXSPAN算法 web日志挖掘
在线阅读 下载PDF
一种基于改进的AprioriAll算法的Web路径模式挖掘 被引量:4
15
作者 司应硕 杨世平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期172-175,共4页
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。
关键词 路径模式挖掘 web数据挖掘 大引用序列 AprioriAll算法
在线阅读 下载PDF
分布式Web用户兴趣迁移模式挖掘研究 被引量:1
16
作者 金玮 张克君 +1 位作者 曲文龙 杨炳儒 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期44-47,共4页
提出了一个结合Web文本挖掘的分布式Web使用挖掘模型DWLMST,以及基于该模型的局部浏览兴趣迁移模式更新算法LITP和全局浏览兴趣迁移模式更新算法GITP。利用页面聚类来表示用户兴趣。通过将用户事务中的页面替代为相应的聚类号来得到用... 提出了一个结合Web文本挖掘的分布式Web使用挖掘模型DWLMST,以及基于该模型的局部浏览兴趣迁移模式更新算法LITP和全局浏览兴趣迁移模式更新算法GITP。利用页面聚类来表示用户兴趣。通过将用户事务中的页面替代为相应的聚类号来得到用户浏览兴趣序列。从用户浏览兴趣序列中分析得到用户浏览兴趣迁移模式。算法较好地解决了Web访问信息的异地存储、实时增长等因素给模式分析过程带来的困难,同时也提高了用户浏览兴趣表示的准确性。 展开更多
关键词 web使用模式挖掘 分布式数据挖掘 web日志挖掘
在线阅读 下载PDF
基于Apriori的Web访问模式挖掘算法 被引量:3
17
作者 刘美玲 苏毅娟 《计算机与现代化》 2013年第10期1-5,共5页
简要介绍Apriori算法与Web访问路径的有向图表示方法,提出一种从Web日志文件中得到频繁访问模式的算法,该算法以Apriori算法为基础,并以访问路径序列的有序性特点作为候选集的剪枝策略,减少候选集的生成,提高算法的效率。在真实数据集... 简要介绍Apriori算法与Web访问路径的有向图表示方法,提出一种从Web日志文件中得到频繁访问模式的算法,该算法以Apriori算法为基础,并以访问路径序列的有序性特点作为候选集的剪枝策略,减少候选集的生成,提高算法的效率。在真实数据集和模拟数据集上分别进行实验,实验结果表明该算法是有效的,且适应性好。 展开更多
关键词 WFTP算法 web日志文件 数据挖掘 频繁访问路径 有序访问路径
在线阅读 下载PDF
Web日志挖掘中的用户访问模式识别 被引量:2
18
作者 刘沛骞 郭海儒 袁玲玲 《雁北师范学院学报》 2006年第2期23-25,共3页
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问... 本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度. 展开更多
关键词 web日志挖掘 访问序列 频繁访问模式
在线阅读 下载PDF
WEB日志挖掘过程研究 被引量:1
19
作者 王春霞 《商丘师范学院学报》 CAS 2005年第5期71-74,共4页
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支,它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明We... 在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支,它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题. 展开更多
关键词 数据挖掘 web日志挖掘 数据预处理 模式识别
在线阅读 下载PDF
Web日志挖掘在校园网建设中的应用研究 被引量:1
20
作者 贾丙静 葛华 +1 位作者 王传安 赵海燕 《安徽科技学院学报》 2010年第3期38-41,共4页
在Web日志挖掘的基础上,构建挖掘系统模型,采用模糊聚类方法对采集的日志数据进行聚类,得到用户的访问模式,从而指导校园网网站管理人员改善Web站点结构,提高用户查找信息的准确率和效率。
关键词 web日志挖掘 数据处理 用户模式 模糊聚类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部